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亲爱的 读者： 

我先做个自我介绍。 

我不是什么招聘人员。我只是一名软件工程师。正因如此，我深知大家要在面试现场迅速想 
出梢妙算法并在內板上写下完美代码的感受。之所以能感同身受，是因为我与你们冇过同样的经 
历，我参加过谷歌、微软、苹果.亚马逊以及其他诸多公司的面试。 

而且，我也当过面试官，让求职者做同样的亊情。我还筛选过成千上万份简历，在其中“上 
下求索”，希望挑出那些或许能在面试难关中脱颖而出的 T . 程师。在谷歌时，我与招聘委员会的 
同僚有过激烈争辩，探讨某位求职者是否达到了录用要求。我对招聘各环节了如指掌，相关经验 
也很丰富。 

而现在，我亲爱的读者，你也许要在明天、下周或是明年去迎接面试挑战。你可能已经拿到 
或者正在攻读计算机科学或相关专业的学位。本书并不打算给人家重温有关二叉査找树的基本知 
识，或者该如何遍历链表。想必你已经掌握这些 内容； 倘若没有，还请先找些数据结构的基础资 
料仔细研读。 

本书旨在帮助你加深对计算机科学基础知识的理解，并学会该如何运用这些基础知识，成功 
闯过技术面试这一关 o 

本书在第四版的基础上做了大 M 更新，增补篇幅达200多页。第五版添补了不少面试@，修 
订了部分原有题目的解法，并新增了几个章节和其他内容。欢迎访问我们的网站，你可以跟其他 
求职者互通有无，发现新天地。 

与此冏时，我也感到无比兴奋，你一定能从本书中学到新的技能。充分的准备会让你在技术 
和人际沟通技能等诸多方面更进一步。不管最终结果如何，只要拼尽全力，无怨无悔！ 

请各位读者务必用心研读本书前面的介绍性章节，其中的要点和启示也许可以决定你的面试 
结果，“录用”与“拒绝”就在一线之间。 



此外，切记——面试非易事！根据我在谷歌多年面试的经历，我留意到有些面试官会问一些 
“简单的”问题，有些则会专挑难题来问。但是你知道吗？面试中碰到简单的问题，也不见得就 
能轻松过关。完美解决问题（只有极少数求职者才能做到！）不是公司录用你的关键，只有題答 
得比其他求职者更出色才能让你脱颖而出。所以，碰到棘手的难题也不要惊慌，或许其他人一样 
觉得很难。 

请努力学习，不断实践。祝你好运！ 


盖尔•拉克曼 • 麦克道尔 
CareeiCup.com 创始人兼 CEO 
(金领简历： 敲开苹果、微软、谷歌的 大门》 及本书作者 
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招聘中的问题 

讨论完招聘亊宜，我们又一次沮丧地走出会议室。那天，我们重新审査了十位“过关”的求 
职者，但是全都不堪录用。我们很纳闷，是我们太过苛刻了吗？ 

我尤为失望的是，我推荐的一名求职者也被拒了。他是我以前的学生，以髙达 3.73 的平均分 
( GPA ) 毕业于华盛顿大学，这可是世界上最棒的计算机专业院校之一 u 此外，他还完成了大 tt 
的开源项目工作。他梢力充沛、富于创新、踏实能干、头脑敏锐，不论从哪方面来看，他都堪称 
真正的极客。 

但是，我不得不同意其他招聘人员的 看法： 他还是不够格。就林我的强力推荐可以让他饶幸 
过关，在后续的招聘环节还是会失利，因为他的硬伤太多了。 

尽管面试官都认为他很聪明，但他答题总是递睡绊绊的。大多数成功的求职者都能轻松搞定 
第一道题（这一题广为人知，我们只是略作调整而已），可他却没能想出合适的算法。虽然他后 
来给出了一种解法，但没有提出针对其他情形进行优化的解法。最后，开始写代码时，他草草地 
采用了最初的思路，可这个解法漏洞百出，最终还是没能搞定。他箅不上表现最差的求职者，但 
与我们的“录用底线”却相去甚远，结果只能是铩羽而归。 

几个星期后，他给我打电话询问反馈意见，我很纠结，不知该怎么跟他说。他需要变得更聪 
明些吗？不，他其实智力超群。做个更好的程序员？不，他的编程技能和我见过的一些最出色的 
程序员不相上下。 

跟许多积极上进的求职者一样,他准备得非常充分。他研读过 Brian W . Kemighan 和 Dennis M . 
Ritchie 合著的 《 C 程序设计语言 >, 麻省理工学院出版的《算法 导论》 等经典著作。他可以细数 
很多平衡树的方法，也能用 C 语言写出各种花哨的程序。 

我不得不遗憾地告 诉他： 光是看这些书还远远不够。这些经典学院派箸作教会了人们错综复 
杂的研究理论，对程序员的面试却助益不多。为什么呢？容我稍稍提醒你 一下： 即使从学生时代 
起，你的面试官们其实都没怎么接触过所谓的红黑树 （ Red - BlackTrees ) 算法。 

要顺利通过面试，就得“真枪实弹”地做准备 3 你必须演练真正的面试题，并掌握它们的解 
题模式。 

这本书就是我根据自己在顶尖公司积累的第一手面试经验提炼而成的精华。我曾经与数百名 




2 前言 


求职者有过“交锋”，本书可以说是我面试几百位求职者的结晶。同时，我还从成千上万求职者 
与面试官提供的问题中精挑细选了一部分。这些面试题出自许多知名的高科技公司。可以说，这 
本书囊括了 150道世界上最好的程序员面试题，都是从数以千计的好问题中挑选出来的。 

我的写作方法 


本书重点关注算法、编码和设计 问题。 为什么呢？尽管面试屮也会有“行为问题”，但是答 
案会随个人的经历而千变万化。同样，尽管许多公司也会考问细节（例如，“什么是虚函数？ ”）, 
但通过演练这些问题而取得的经验非常有限.更多地是涉及非常具体的知识点。本书只会述及其 
中一些问题，以便你了解它们“长”什么样。当然，对于那些可以拓展技术技能的问题，我会给 
出更详细的解释。 

我的教学热情 

我特别热爱教学。我 客欢帮 助人们理解新概念，并提供一些学习工具， 从而充 分激发他们的 
学习热情。 

我第次 “正式”的教学经验是在关国宾夕法尼亚大学就读期间，那时我才大二，担任本科 
计箅机科学课程的助教 （ TA >。 我后来还在其他一些课程中担任过助教，最终在大学里推出了自 
己的计算机科学课程，也就是给大家教授一些实际的“动手”技能。 

在谷歌担任工程师时，培训和指导 “ Nooglers ” （意指谷歌新员工。没错，他们就是这么称呼 
新人的！）是我最軎欢的工作之一。后来，我还利用 “20%自由支配时间"在华盛顿大学教授计 
算机科学课程。 

《程序员面试金 典》、 （金领 简历》 和 CareerCup . com 网站都能充分体现我的教学热情。即便 
是现在，你也会发现我经常出现在 CareeiCup . com 上为用户答疑解惑。 

请加人我们的行列吧！ 


Gayle Laakmann McDowell 
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生命中很多事情都离不开团队合作，这本书也不例外。在创作本书的过程中，我得到了很多 
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其次，我要感谢家母，她让我认识到编程无比重要，而写出优美流畅的文宇更为重要。毫无 
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W ' n . 我还钽感谢那畔给述 i 义的读 荇: 谢谢你们!我要特别感谢维尼特•萨哈和普 
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□ 概述 

□ 面试题的来源 
□ 准备时间表与注意亊项 
□ 面试评估流程 
□答题情况 
□若装规范 
□ 十大常见错误 
□ 常见问题解答 

1.1 概述 

大多数公司的面试流程其实都大同小异。本章会简述面试流程，以及企业到底想招募什 
么样的人才。这些信息将指导你如何做好面试准备，以及在面试过程中和面试结束后该如何 
应对。 

收到面试通知后，你通常得先经历一次筛选面试 （ screeninginterview ), —般通过电话进行。 
顶尖高校的应届毕业生则可能笛要参加现场的筛选面试。 

不要因“筛选面试”这个词儿而掉以轻心，筛选面试也很有可能涉及编码与算法问题，要求 
不见得比现场面试低。如果不确定它是不是技术筛选面试,不妨问问招聘助理面试官是什么来头， 
若是工程师，那十有八九会与技术相关。 

许多公司会在面试中运用在线同步文档编辑系统，但也有可能让你直接在纸上写好代码，然 
后在电话里念给他们听。有些面试官甚至还会给你留"家庭作业”，或是要求你用电子邮件将写 
好的代码发给他们。 

在现场面试 （ on - siteinterview ) 之前，通常会有一两轮筛选面试。现场面试大概有4到6轮， 
其中一轮可能是午餐面试。当然，午餐面试比较随意，面试官一般不会问你技术问题，甚至不会 
纳人面试评价范畴。但同时，这也是难得的好机会，你可以跟面试官探讨自己感兴趣的问题，了 
解公司的企业文化。其他几轮面试主要涉及技术问题，包括编码和算法等。此外，你可能还要回 
答与简历相关的问题。 



2 第 1 章面试流程 


面试结束后，面试官们会聚在一起讨论你的表现，或者提交书面评价。大多数情况下，公司 
招聘人员都会在一周内给你回复，告知应聘进展。 

要是已经望穿秋水等了一个多星期，你也可以主动询问进展。就算招聘人员没有回应，也并 
不表示你被拒了（至少大的高科技公司是这样，其实几乎所有公司都是如此)。我再重复 一次： 
没有回应表示你的应聘结果还是未知数。当然，人们都希望招聘方在得出最终结论时，及时通知 
求职者。 

拖拖拉拉的情况确实有。等不及的话，不妨问问相关招聘人员，但务请有礼有节。招聘人员 
和我们一样，他们很忙，有些人会因此容易忘事。 

1.2 面试题的来源 

求职者经常会问我，某些公司最近都苒欢问哪牲面试题？他们总以为面试题会应时而变。 
实际上，公司本身对面试题并没有什么倾向，这完全取决于面试官的个人喜好。容我解释 

—下 0 

在大公司里.曲试官通常需要先参加一些面试培训课程。在谷歌，担任面试官之前.我先参 
加了一次由外部公司提供的专门培训。培训课程为期一天，有一半时间侧重于法律层面的事务， 
比如，面试官不能探问求职者的婚姻状况，不得询问种族，等等。另-半时间则在探讨如何应对 
“刺头”求职者，比如当问及编码问题或其他令求职者认为是在“羞辱”自己的问题时，要是求 
职者“暴跳如常_’，该怎么应对。培训过后，我乂实地观摩了两次真正的面试，然后就开始独自 
面试了。 

就是这样。我们受过的培训也不过如此，其实所有公司都大同小异。 

根本就不存在什么“谷歌官方面试题清单”，也从来没有人要求我一定要问哪些特定的问题， 
或者必须避开哪些话题。 

那我的面试题从何而来呢？其实，来源和大家一样。 

面试官也当过求职者，他们会借用自己当年被拷问过的题目。又或者，有些面试官也会彼此 
交换题库。还有些人喜欢上网找问題，比如 CareerCup . com 网站。有些面试官也可能从上述渠道 
收集面试题，并或多或少做些调整。 

就算真有公司给面试官准备好问题清单，这种情况也并不多见。面试官通常也会自行挑选问 
题， 而且大家往往会有五六个常用的备选题 S 。 

因此，下次在你想知道谷歌“最近”都问些什么问题的时候，不妨先停下来想一想。谷歌与 
亚马逊的面试题其实没什么不同，他们需要的都是软件开发人才。至于面试题是不是“最近流行 
的”也就更无关紧要了。万变不离其宗，因为这本来就得靠面试官自己去把握。 

当然，总体上，不同的公司在风格上存在差异。互联网公司往往会提些系统设计方面的问题， 
而那些使用数据库的公司则明®偏爱数据库方面的问题。然而，大部分面试题无外乎就是数据结 
构和算法之类的，任何公司都会问到。 
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1.3 准备时间表与注意事项 

“台上一分钟，台下十年功”，事实上你的面试表现取决于你的功底——离不开多年的积淀。 
你需要刚好具备能为公司所用的技术经验，然后还要准备好在面试中解决实际的技术问题。下面 
的时间表和流程图可以给你一些 启发。 

如果你起步比较晚，也不用担心。“尽人事.知天命”，请安心准备，祝你好运！ 
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1.4 面试评估流程 


招聘人员可能会告诉你，他们主要考查四个 方面： 工作经验、企业文化契合度、编程技能及 
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分析能力。这四个方面相辅相成，但在决定录用与否时，分量最重的通常还是编程技能和分析能 
力 （ 或者看你是否聪明)。这也是为什么本书的主要篇幅都在探讨如何提升编程与算法技能。 

当然，虽说编程与算法技能往往最为重要，但并不表示你可以忽视其他两个方面。 

一旦进人大型科技公司的面试环节，你之前的工作经验就不是特别重要了，但它可能会左右 
面试官对你的看法。比如，如果你说起以前写的某个复杂程序的精彩之处，面试官很有可能 会想： 
“哇，她坷真聪明!” 一旦他认定你智力超群，可能就会下意识地忽略你所犯的小错误。总之，面 
试并不会十分精确，对某些“软问题”做好充分准备会大有禆益„ 

创业公司比大公司更看重企业文化契合度（或你的个性，主要看是否与公司合拍)。举个例 
子，如果公司的企业文化鼓励员工独立做决定，那么喜欢听从指导的人就不太适合了。 

此外，求职者因为过于自大、巧辩或抵触而被淘汰的情况也并不少见。我就遇到过，有位求 
职者对我提问的用词吹毛求疵，并抱怨这导致他解题不太顺利.后来他还对我的引导方式心生不 
满。这种“抵触心太重”的表现其实也是一个瞥示，果然，其他面试官对他的感觉也很不好。最 
后他被淘汰了。谁会愿意跟这种人一起共事呢？ 

所以，你应该注意以下几点。 

□如果人们都认为你骄傲 A 大、过于狡辩，或有其他负面评价，那你最好在面试中收敛一 
下。个性不讨客的话，哪怕你的表现再好，也可能会被拒。 

□准备一些与简历相关的问题。虽然这不是最欺要的因素，但也不能掉以轻心。稍微花点 
时间准备就能起到很好的效果，做到“四两拨 f 斤”。 

□ 把主要精力用在编程与算法问題上。 

最后，我还是要#强调一遍，面试并不会十分精确。你的表现可能会有失水准，招聘委员会 
(或不管是谁）有时候也会做出错误判断。就像任何群体一样，招聘委员会也可能会被某位主导 
人物的观点所左右。这也许不公平，但这就是生活。 

记住——这次被栴绝并不代表永远。一年内你还可以重新应聘，很多求职者都有过失利后再 
成功的经历。 

不要气俊，失败是成功之母。 

1.5 答题情况 

有则谣传流传甚广 IL 颇具迷 惑性： 求职者必须答对全部问题才会被录用。事实绝非如此。 

首先，面试题的答案很难用“正确”和“错误”去简单评判。我个人在评估求职者的面试表 
现时，一般不会只看他们答对了几道题。相反，我会考量其最终解法是否最优，用时多久，代码 
整沽与否。这不只是单纯的是非判断，还要综合考虑很多因素。 

其次，你的面试表现还会拿来跟其他求职者作比较。比如说，你用15分钟出色地解决了一道 
题，而另一个人不到5分钟就搞定了一道比较容易的题，是否就意味着那个人的表现比你好呢？ 
也许是，但也未必。很自然，面试官出的题越简羊，他们越是希望你尽快给出最佳答案。但要是 
题目很难，他们也不会指望你能答得又快又好，毕竞，出点纰漏也是在所难免的。 
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我在谷歌评估过数千名求职者的面试资料，其中只有一位求职者的面试表现堪称“完美无 
瑕' 其他人，包括最后被录用的几百个幸运儿，都或多或少犯过一些错。 

1.6 着装规范 

软件工程师一般都穿得比较随意。这一点从面试的着装规范也看得出来。参加面试时，推荐 
做法是穿得比同级别员工稍好 一点。 

以下是我给软件 T ： 程师（及测试人员）的面试着装建议，意在让大家找到一个“平衡 点”： 
不要穿得过于正式，也不要太随意。其实，有很多人还是穿着牛仔裤和 T 恤衫参加创业公司或大 
公司的面试，也不会有什么问题。毕竟，公司不是看你穿什么，而是看你的编程水平。 



创业公司 

微软、谷歜、亚马班、 Facebook 等科技巨头 

非科技公司（包括银行） 

男性 

•裤、休闲裤或整沽得休的牛 
仔裤。 Polo 衫或礼服 M 衫 

•裤、休闲 捭或整 沽得体的牛仔縳。 Polo 
衫或礼 服衬衫 

金装，不打领带（可带 
•条领带以防 万一〉 

女性; 

kit •裤、休闲裤或《沾得休的牛 
\m, 大方得体的 h 衣或毛衣 

pnm. 休闲 w 或整洁得体的牛 仔濟。 大方 
得体的 k 衣或毛衣 

耷装，或得体的休闲彿 
fid 螫沽的上衣 


这些只是指导建议，具体还要参考公司的企业文化。此外，如果你应聘的是项目经理、开发 
主管或其他管理层职位，面试时最好还是穿得正式一点。 

1.7 十大常见错误 

错 误一： 只在计算机上练习 

如果你正准备参加海洋游泳比赛，你会只在泳池里练习吗？应该不会。你得去体验大风大浪 
及海洋里各种情况带来的影响。所以，你肯定会希望到海洋中实地训练。 

在计算机上借助编译器演练面试题就像只在泳池里练习一样。抛开这个环境吧，让我们拿出 
纸和笔。你可以在写好全部代码并做过人工测试之后，再在计算机上用编译器进行验证。 

错 误二： 不做行为面试题演练 

很多求职者将全部时间花在演练技术问题上，而忽视了行为面试题。你猜怎么着？面试官可 
是两者都会考查的。 

而且不止于此，你回答行为问题的表现其实还会左右面试官对你技术能力的看法。行为问题 
的准备工作其实相对比较轻松，而且容易达到事半功倍的效果。用心回顾你以往的项目和经历， 
然后准备一些小故事。 

错 误三： 不做模拟面试训练 

假设你要准备一场重大演讲，所有同事和相关人员都将列席，而且它还关乎你的未来。要是 
只在头脑里无声地练习演讲，到了真正演讲时，你肯定会发狂的。 

光是纸上谈兵，不做模拟面试也会陷人同样的境地。如果你是一名 T 程师，肯定认识不少同 
行。不妨找个朋友帮你做模拟面试。作为回报，你也可以给他当一回面试官。 
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错 误四： 试图死记硬背答案 

死记硬背答案最多只能解决一些特定问题，但是一碰到新的题，你可能就傻眼了。而且，基 
本上你不太可能碰上出自本书的题目。 

最靠谱的做法就是，不看答案，先把书里的题全部认真做一遍。这样你才有时能练就各种技 
能和技巧，从容应对新问题。就算最后你只能大概复习一下为数不多的题，这种做法也会对你很 
有帮助。质最胜丁数量。 

错 误五： 不大声说出你的解题思路 

透露个 秘密： 面试官才不会知道你心里想什么。因此，面试时畎不作声，我根本无法了解你 
的思路。假如你沉默时间过长，我还会误以为你毫无进展。你得多出声，没准说着说着就找到了 
解法。请大声说出解题的思路，这样面试官就会知道你还在处理这个问题，没有卡壳。 

这么做还有个好处就是不至于跑题，从而有助于你尽快找到解法。当然，最大的作用就是突 
M 你强大的沟通能力。何乐而不为呢？ 

错 误六： 过于仓促 

写程序不是什么竞赛，面试也不是，所以解题时不要太过仓促。代码写得太草率容易出问题, 
也说明你这个人不够细心。请放慢节奏.有条不紊，多做测试，问题考虑得周全些。这么一来， 
最终你反而能更高效地给出答案，错误也会少一些。 

错 误七： 代码不够严谨 

其实每个人都写得出完美的代码，但有时我们还是会在面试中写出错议百出的程序，不是 
吗？代码冗余，数据结构乩七八糟（比如，缺少面向对象设计）等等，这些都是常见错误！写代 
码时，不妨设想一下你是在处理实际问题，要注 窀可维 护性。将代码划分成不同的子程序，并粘 
心设计数据结构来处理相应的数据。 

错 误八： 不做测试 

在日常丁作中，你不可能不做任何测试就提交代码，既然如此，为什么要在面试中畨略这 • 
步呢？写完代码后，请“运行”（或者审 査）一 下程序来验证结果。或者.在处理复杂问题时， 
你还可以边写代码边测试。 

错 误九： 修正错误漫不经心 

程序总会有 bug , 这就是生活或编程的本来面目。只要用心测试你的代码， bug 也许就会现出 
原形。 那也 不错。 

不过，重要的是发现 bug 时，你必须三思而后行，修正之前先确定出错原因。有些求职者看 
到传人特定参数时函数返回 false 而不是 true , 会直接将返回值取反，接着检查问题是否得到修 
正。当然，偶尔他们也能瞎猫碰上死耗子，但实际上如此仓促行事往往会导致更多的 bug , 同时 
也反映出你这个人比较粗心 大意。 

有 bug 其实很正常，但胡乱修改代码却很严重。 

错 误十： 轻言放弃 

我知道面试题都很难，但不难怎么显出求职者的水平呢。你会迎难而上还是轻言放弃？态度 
很重要，面试官都喜欢那些不畏挑战、迎难而上解决问题的求职者。毕竟，面试本来就不简单。 
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所以，碰到棘手的问题请不要惊慌，也不要轻言放弃。 

1.8 常见问题解答 

1. 碰到熟悉的问题时应该如实相告吗？ 

是的！碰到熟悉的问题，当然要告诉面试官！有些人会觉得这很傻一要是熟悉这个问题 
(并知道答案），岂不是如虎添翼，对吧？其实，未必如此。 

我们力荐你如实相告的理由如下。 

(1) 彰显你的诚实 品质。 这能反映出你的诚信 一 可以大大加分! •要知道面试官可是在默默 
地考察你，肴你够不够格成为他未来的同事。我不知道你个人怎么想，反正我是喜欢和实在人一 
起共亊。 

(2) 这个问题可能略有改动。你不会想 冒这个 险给个错误答案吧？ 

(3) 如果你将正确答案脱口而出，面试官会觉得很可疑。面试官当然知道题 S 的难度。但如 
果你佯装磁硝绅绊地答题，则很有可能夸张过度.而显得你这个人很不诚实。 

2. 该使用哪种编程语言？ 

很多人都会建议说用自己最得心应手的语言，其实理想情况下，你应该使用面试官圾熟悉的 
语言。我一般会推荐使用 C 、 C ++ 或 Java , 因为大多数面试官都熟悉这三种语言。我个人偏好 
Java (除非涉及 C / C ++ 问题).因为用 Java « 写程序效率比较高.而且写出来的程序简单 M 懞.哪 
怕平时用惯 C ++ 的人看 Javag 序也不会有太大难度。有鉴于此.本书基本上都用 Java 来解题。 

3. 面试结束后我没有收到回复，是被拒了吗？ 

不是的。真要被拒的话，公司一般都会给你通知。面试结束后短时间内没有收到回复并不代 
表什么。你可能表现得很不错，但招聘人员不巧度假去了，没能及时处理。公司可能正在进行部 
门重组，具体该招多少人尚无定论。又或者，你确实表现得不怎么样，但碰巧遇到了一个办亊拖 
拉或者特别忙的招聘人员，他没能及时答复你。当然，也会有一些奇怪的公司。“嗯，既然我们 
不打算录用这个求职者，那就没必要给他回复。”所以，一切取决于公司本身。但你可以发邮件 
或打电话跟踪后续进展。 

4. 被拒之后我还能 重新申 请吗？ 

当然可以了，不过通常需要等上一段时间 （半 年至一年)。上一次的糟糕表现一般不会影响 
下一次面试。很多人都被微软、谷歌拒过，但他们后来还是顺利过关了。 
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□ 微软面试 
□ 亚马逊面试 
□ 谷歌面试 
□苹果面试 
□ Facebook 面试 
□雅虎面试 

对于多数求职者而言.面试好似一个迷局。你去了，见了几个面试官，答了一堆问题，然后， 
或两手空空离开，或幸运地拿到录用通知。 

你有没有 想过： 

□ 面试结果是怎么得出的？ 

□ 面试官会不会互相交流？ 

□ 公司最看重哪些方面？ 

好了，不用再挖空心思、再二思索了，我来告诉你。 

在本章，我们遨清了来自顶尖科技公司（微软、亚马逊、谷歌、苹果、 Facebook 及雅虎）的 
面试专家来为大家答疑解惑，揭秘面试中的那些事儿。 

这些专家会让我们了解各家公司的面试流程.帮助还原那些发生在面试会议室之外的事情， 
以及面试结束后的事项。 

这些专家还会告诉我们各家公司面试流程的不同之处。比如，亚马逊的“调杆员” ® 是怎么 
回事，谷歌的招聘委员会是如何运作的。是的，每家公司各具特色。了解这些“怪癖”会让你更 
加胸有成竹，不会被突如其来的亚马逊“调杆员"给吓住，也不会对苹果居然同时派出两位面试 
官来考察你而感到意外。 


① “barraiser" (调杆员）的概念来自亚马逊美 S 总部。这个词原指在跳高比赛中，一次次将杆调高的工作人员。而 
亚马逊的调杆员則是一群在招聘过程中负贵从企业文化以及行为准 W 的角度考察应聘者，从而维护招聘质童的 
人。在招聘中.调杆员会用很苛刻的眼光考察应聘者是否在至少一点上高过 S 马逊的平均水准，如果是.那么雇 
用这样的人实际上就等于在提升公司的能力，这就起到了 “抬杆"的作用。一编者注 
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此外，这些专家也强调了各家公司的面试重点。尽管这些顶尖公司都喜欢考察求职者的编码 
能力和算法基础，他们其实也各有侧重。不管这是源自各家公司的技术背景或是历史，至少你知 
道该如何做好准备。 

接下来，让我们一起揭开微软、亚马逊、谷歌、苹果、 Facebook 和雅虎的“面试迷局”吧。 

2.1 微软面试 

微软喜欢招聪明人，尤其靑睐汁算机极客。求职者必须对技术满怀热情。微软的面试官不大 
会问你一些 C ++ API 的个中细节，而是直接让你在内板上写代码。 

参加面试时，求职者最好在早上约定时间之前赶到微软，先填好一些表格。接着你会和招聘 
助理碰面，他会给你一个面试样题。招聘助理主要是帮你热热身，不大会问技术 问题； 就算真的 
问了几个简单的技术问题，也是想让你放松心情，等到面试真正开始时，你就不会那么紧张了。 

对招聘助理一定要以礼相待。说不定他们会帮上大忙，在你首轮面试表现欠佔时，他们有< 
能帮你争取: f : 新曲试的机会。夸张地说，他们甚至还能左右你的应聘结果。 

面试当天你会接受4〜5轮面试，面试官•般来 
自两个团队。许多公司会把面试安排在会议室，而 
微软的面试一般在面试官的办公室进行。你正好可 
以借机四处看看，感受一下他们的团队文化。 

一轮面试过后，不同的团队，做法不一样，面 
试官可能会根据个人习惯决定是否将你的表现反 
馈给后续的面试。 

完成所有面试后，你有 nJ 能会见到招聘经理。 

假如真是这样的话，那可是好兆头，这意味狞你通 
过了某个闭队的基本考察。接下来，就要看招聘经 
理要不要录用你了。 

快的话，面试当天你就会知道结果，慢的话， 

则可能要等上一周。要是等了一周还没收到人事部 
的通知，不妨发封邮件，客气地问一下进展。 

如果你没有马上收到回应，有可能是因为招聘 
助理太忙了，这并不代表你就没戏。 

2.2 亚马逊面试 

亚马逊的招聘流程一般从两轮电话面试开始.期间求职者会接受某个团队的面试。偶尔也会 
出现面试3轮甚至更多轮的情况，可能是有位面试官对你的评价不高，或是别的团队对你有兴趣。 
此外，还有其他特殊情况，比如求职者就在亚马逊总部所在地西雅图，或他以前面试过其他职位， 
也许一次电话面试就够了 3 


必要准备事项 

“你为什么想要加入微软？” 
提这个问題，微软是想了解你是否 
对技术满怀热情 - 一个比较好的答案 
是： “自打接触计算机以来，我就一直 
在用微软的软件，贵公司开发的软件产 
品令人赞不绝口比如，我最近一直在 
Visual Studio 开发环境中学彳游戏编程， 
它的 API 实在是太好用了。”注意这个答 
案是如何展示你对技术满怀热 情的。 

独特之处 

如果到了招聘经理这一关，说明你 
面试表现得不错这可是个好兆头！ 
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在电话面试中，面试你的工程师通常会要求你通过共享文档工具（如 CollabEdit ) 写些简单 
的代码。他们问的技术问题可谓五花 A 门，意在探测你究竟熟悉哪些领域。 

接下来，如有一两个团队根据你的简历和在电话面试中的表现相中你，你就要飞到西雅图接 
受4 〜 5轮面试。在白板上写代码是少不了的，有些面试官会着重考察你的其他技能。每一轮面试 
官都会侧重不同的领域，所以他们的提问会大相径庭。匕提交自己的评价报告之前，他们看不到 
其他面试官对你的评价，而且公司也不鼓励面试官 
在面试过程中互相交流，一切讨论都得等到几轮面 
试全部结束后。 

顾名思义，“调杆员”主要负责把控面试质量。 

他们受过专门训练，并且是从其他团队抽调来的， 

以减少面试中的主观倾向。在面试中，如果有位面 
试官风格迥异且要求格外严格，那他可能就是传说 
中的“调杆员"。这种人不仅面试经驗丰富，而且 
跟招聘经理一样，拥有生杀大权。不过，切 记：这 
—轮面试表现磕磕绊绊，并不等于你的整体表现就 
很差。面试官会比照其他求职者来评价你的水平， 

而不是只看你答对多少问题。 

等到所有面试官提交评价报告后.他们会在一 
起讨论你的表现，并决定是否录用你。 

一般来说，亚马逊的招聘 闭队都 会很快给出录 
用结果，很少有耽搁。要是一周内都没等到结果， 

建议你发封措辞得当的邮件询问进展。 

2.3 谷歌面试 

业界流传着很多有关谷歌面试的可怕潘传，但多数也只是摇传。谷歌的面试与微软或亚马逊 
的并无太大区别。 

谷歌的面试也从电话面试开始，来面试你的人是技术工程师，因此免不了会问些技术难题， 
求职者切不可掉以轻心。这些问题也可能涉及编程，有时你还要通过共享文档 T . 具写些代码。电 
话面试的问题和现场面试的类似，要求也一样。 

现场面试一般有4〜6轮，其中一轮为午餐面试。面试官之间不能透露自己的评价报告，因此 
每一轮面试你都可以从零开始。午餐面试不会有评价报告，你可以借机问些其他环节不方便问的 
问题。 

谷歌不会要求面试官侧重不同的领域，也没有所谓的标准流程或结构。每个面试官可以自行 
决定问哪些问题。 

面试过后，评价报告会以书面形式提交给由工程师和经理组成的“招聘委员会' 由他们作 


必要准备事项 

亚马逊是一家互联网公司，这也意 
味着他们非常关注“扩展性”问題 。请 
做好相应的准备.当然，回答这些问題， 
并不要求你具备分布式系统方面的知 
识。具体建议可参看“扩展性与存储限 
制"一节。 

此外，4马逊还会问很多面向对象 
设计的问题3请参看“面向对象设计” 
一节，里面有一些样題和建议。 

独特之处 

“调杆员”来自其他团队，旨在提 
高面试标准 3 他和招聘经理一样重要， 
请尽量表现得出色一些。 



12 第 2 章 面试揭秘 


出录用结论。面试评价报告由分析能力、编程水平、 

T 作经验和沟通能力等四部分组成，最后你会得到 
总的评分，在 1.0 到 4.0 之间。“招聘委员会”里一般 
不会有你的面试官。就算有，那也纯属巧合。 

通常，在决定录用与否时，招聘委员会更看重 
那种有面试官给你打高分的情况，打个比方，如 
果你的得分是3.6、3.1、 3.1 和 2.6, 效果要好过拿4 
个3.1。 

也就是说，每轮面试不一定都要有上佳表现。 

此外，你在电话面试中的表现一般起不了决定性 
作用。 

如果招聘委员会给出的意见是“聘用”，你的 
材料就会转给“薪酬委员会”及“执行管理委员会”。 

最终结果可能要等上几周，因为还有不少流程要 
走，等待多个委员会审批。 

2.4 苹果面试 

苹果的面试流程与公司本身的风格非常相符，是最没官僚味儿的。苹果的试官很看茧技术 
功底，但求职者对应聘职位和公司的热情也非常重要。虽然成为 Mac 用户并不是应聘苹果的先决 
条件，但你至少要对该系统有一定了解。 

在苹果的面试流程中.招聘助理会先给你打电 
话了解一些基本情况.接下来团队成员会对你进行 
一连串的技术电话面试。 

当你受邀去参加现场面试时，招聘助理会出面 
接待你，并介绍面试的大致流程。然后，你要接受 
招聘团队成员6〜8轮的面试，其中这个团队的重要 
人物也会来面试你 u 

苹果的面试形式是一对一或二对一。请做好在 
白板上写代码的准备，交流的时候一定要把自己的 
思路表达清楚。你可能会跟未来的上司共进午餐. 

这看似随意，但其实也是一次面试。每个面试官都 
会侧重不同的领域，面试官之间一般不会过问彼此 
的面试情况，除非他们想让后续面试官就求职者某 
—方面多挖掘点内容。 

当天所有面试结束后，面试官会在一起商议你 


必要准备事项 

如果你知道哪个团队会来面试你， 
务必先熟悉他们的产品。你喜欢该产品 
的哪些方面？你觉得有哪些可以改进 
的地方？给出独到见解可以有力展示 
你对这份工作的激情。 

独特之处 

在苹果的面试中，二对一的形式司 
空见慣，不过也不用太紧张——这跟一 
对一面试并无分别。 

此外，苹果的员工都是超级果粉， 
在面试中，你最好也能展现出同样的 
热情。 


必要准备事项 

作为一家互联网公司，谷歌非常看 
重如何设计可扩展的系统。因此，务必 
掌捱“扩展性与存储限制”一节的问題。 
此外，谷歌的面试官很喜欢问些涉及 
“位操作”的问题，也请重点复习这些 
方面的知识。 

独特之处 

面试官不是决策者。他们只提交评 
价意见供招聘委员会参考。招聘委员会 
给出录用与否的决定，当然，该决定偶 
尔也会被谷歌高管否决。 
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的表现。如果大家都认为你表现不错，接下来会由你应聘部门的主管或副总来面试你。能见到主 
管也不见得你一定会被录用，不过总归是个好兆头。让不让你见主管的决定对你是不公开的，如 
果你落选了，他们只是默默送你离开公司，也不会透露你为什么落选了。 

如果你得以进人主管或副总面试环节，面过你的面试官会聚到会议室正式表决录用意见。副 
总通常不会列席，但如果你没能打动他们，他们照样可以直接否决。招聘人员通常会在几天后联 
系你，要是等不及的话，你也可以主动联系。 

2.5 Facebook 面试 

Facebook 的在线工程难题 0 曾引发热议，其实这无非又是吸引眼球的手段之一。除了解答这 
些难题，你还可以通过传统渠道申请该公司的职位，比如提交在线职位中请，或者参加校园招 
聘会。 

—旦被 Facebook 挑中，求职者一般至少要接受两轮电话面试。不过，公司所在地 ® 的求职者可 
以少一轮。电话面试主要涉及技术问题，求职者通常要用 EtheipadiS 其他共享文档工具写些代码。 

如果你还在上学，在学校接受面试，那你还要写代码。面试官会要求你在白板或白纸上写 
代码。 

现场面试时，主要由其他软件工程师来面试你，不过，招聘经理有空的话也会参与。所有面 
试官都受过专业面试培训，他们只提供意见，对你的应聘结果不作决断。 

现场面试的每个面试官都各有侧1,以确保大 
家不 会遊复 提问，并全面考察求职者的能力水平。 

面试问题主要分为算法、编程水平、软件架构/设计 
能力等几大块，同时，面试官也会考察你能否适应 
Facebook 快节奏的开发环境。 

面试过后，在交流你的表现之前，面过你的面 
试官会先提交书面评价报告。这么做是为了确保各 
位面试官能对你的表现作出相对独立的评价。 

一旦收到所有的评价报告，面试小组和招聘经 
理便会商讨你的面试结果。他们会先达成统一意 
见，然后提交给招聘委员会。 

Facebook 很看重"忍术” < 灵活 应变） ——也就 
是使用任何语言快速构建优雅、可扩展解决方案的 
能力。懂 PHP 并不会显得特别突出，因为 Facebook 
也有很多后台工作要用到 C ++、 Python . Erlang 和其 
他语言。 


必要准备事项 

作为网络科技的新贵及‘‘当红炸子 
雄”， Facebook 也更青睐那些富有创业 
精神的开发人员。在面试过程中，你要 
展现出自己热衷创造新事物的激情。 

独特之处 

Facebook 由公司统一招聛员工，而 
不是专门针对某个团队。面试成功并入 
职后，你会先参加为期6周的“新兵训 
练营”，帮你快速适应大规模的代码库 
资深工程师会担任你的导师，辅导你掌 
握最佳实践和必备技能，最终让你可以 
游刃有余地加入自己喜欢的项目组。 


① 感兴趣的读者可以访问贞面 Facebook Engineering Puzzles : www . facebook . com / careers / puzzlcs.phpe -译者注 

② Facebook 总部位于美国加利福尼亚州的门罗帕克市.地址为黑客路1号 （ 丨 Hacker Way )。一译者注 
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2.6 雅虎面试 

雅虎往往只招美国排名前20的高校毕业生，不过其他求职者仍可通过雅虎公开招聘渠道（或 
者，可以内部推荐的话就更好了）得到面试机会。取得面试资格后，你会先接受一轮电话面试。 
对你进行电话面试的一般是资深员工，比如技术主管或经理。 

在现场面试中，一般由来自同一团队的六七个人来面试你，每轮面试时长45分钟。每个面试 
官都会侧重不同的领域。比如，有的面试官可能侧1于数据库知识，而有的面试官则会关注你对 
计算机体系结构的理解。每轮面试的时间安排大致如下。 

□开头5 分钟： 一般对话。比如，自我介绍，聊聊项目经历等。 

□ 中间20 分钟： 编程问题。比如.实现归并排序。 

□ 最后20 分钟： 系统设计问题。比如，设计一 
个大型分布式缓存系统。这些问埋往往与你 
以往的项目经历或面试官当前在做的工作 
有关。 

当天面试结束后，你吋能还会跟项目经理或其 
他人面谈一次。内容包括产品展示、你对雅虎的疑 
虑以及你手上有无其他公司的录用通知，等等。这 
次面谈旨在增进双方了解，通常不会影响你的面试 
结果。 

与此同时，之前的面试官会讨论你的表现并尝 
试作出结论。最终录用与否由招聘经理决定.他会 
综合考虑面试官对你的正面及负面评价。 

如果你的表现+错，有町能当天就会收到口头 
录用通知。但也不一定。也许他们要过几天才通知 
你，个中原因不一，比如，你应聘的闭队可能还想 
再面试几个人看看。 


必要准备事项 

雅虎面试少不了系统设 计问题 ，几 
乎成了慣例，所以，还请做好相应的准 
备他们想要确认你不仅会写代码，而 
且还能设计软件。要是没有这方面的知 
识，也不 要紫， 你仍然可以给出自己的 
设计思路. 

独特之处 

雅虎的电诂面试一般由拥有决定 
权的人 ft 责，比如招聘经理。此外，雅 
虎往往会在当天给出面试结果（如果你 
能入他们法眼），这一点很特别。在你 
进行最后一轮面试的同时，其他面试官 
也正在讨论你的表现。 
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特殊 M 况 


□ 有 T . 作经验的求职者 
□ 测试人员及 SDET 
□项目经理与产品经理 
□ 技术主管与部门经理 
口创业公司的面试 

3.1 有工作经验的求职者 

只嬰你仔细读过之前的章节，遇到以下情况应该也+会太 惊讶： 在面试中，对于有丁作经验 
的求职者和初出茅庐的新手，面试官会问同样的问题，而 li 面试标准差別也不大。 

你可能知道，大多数面试题都是些涉及数据结构与算法的常见问题。多数公司认为这是检验 
个人能力的上佳手段，故而对所有求职者一视同广。 

有些面试官可能会对有工作经验的求职者稍稍提高标准和要求。毕竞，他们有多年的 T . 作经 
验，理应比 新手表 现得更出色，不是吗？ 

不过，也有一些面试官持相反的看法。有 T . 作经验的求职者离开学校太久了，可能毕业后就 
没怎么接触过这些基本概念。他们忘记其屮一些细节也在情理之中，所以我们应该稍微降低标准。 

总体来看，两者相抵。所以，如果你是有工作经验的求职者，碰到的问题和面试标准基本上 
与新手相差无几。不同之处在于系统设计和架构方面以及与你简历相关的问题。 

一般来说，学生在系统架构方面没有什么积累，这类经验只有通过实践才能获得。因此，面 
试官会根据你的经验水平来评估你在这些问题上的表现。当然，在校生和应届毕业生也会被问及 
这方面的问题，总之都要竭尽全力做好准备。 

此外，对于“说说你碰到过的最棘手的 bug ? ”之类的问題，面试官往往期待有工作经验者 
给出更加深人、让人印象深刻的答案。你拥有更丰富的经验.回答自当不同凡响。 

3.2 测试人员及 SDET 

软件开发测试工程师 （ SDET ) 这个职位确实比较复杂。作为 SDET , 不仅要写得一手好代码， 
还得是优秀的测试人员。 
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建议大家从以下几点人手准备 SDET 的面试。 

□准备核心测试问题 ：例如 ，怎么测试一只灯泡？ 一支笔？ 一台收银机？抑或是微软的 Word 
软件？参看本书“测试” 一节，有助于你在这些问题上准备得更充分。 

□练习编程 问题： 应聘 SDET 被拒的最大原因就是编程能力不足。尽管这个职位对编程能力 
的要求比 SDE (软件开发工程师）略低，但面试官还是期待 SDET 具备很强的编程能力和 
算法功底。准备过程中，不妨拿针对普通开发人员的编程和算法题来练手。 

□练习测试编码 问超： 对 SDET 来说，这类问题的常见问法是“写代码实现 X 功能”，紧接着 
就是，“好，请测试你写的代码”。就算面试官没有提这个要求.你也应该问问自己 ：“我 
该如何测试这段代码？” 切记： SDET 可能碰到任何问题！ 

对测试人员来说，具备良好的沟通能力也非常 ® 要，因为这份工作要求你跟各种各样的人打 
交道。因此，不要对行为面试题掉以轻心，可参看“行为面试题”一章。 

职业生涯建议 

最后，提几点职业生涯 建议： 如果你跟许多求职者一样，认为应聘 SDET 职位是进人一家公 
司的“捷径”，那就必须想淸楚，从 SDET 转开发岗位可不轻松。假如你有此意图，务必加强自己 
的编程能力和算法功底，并尽可能在一两年内转岗。否则，“温水煮青蛙”，拖得越久，你的目标 
躭越难以实现。 

总之，常写代码，以防手生。 

3.3 项目经理与产品经理 

不同公司的 PM 职位大相径庭，甚至在同一家公司都可能大不相同。例如，微软有些 PM 职位 
其实相当于"口碑传道者”，职责是面向客户推广公司产品，有点接近市场营销。然而，微软内 
部的其他 PM 则可能每天要花大最时间编写代码。后一种 PM 在面试中很可能会被问到编码问题， 
因为这是 KT . 作职责的重要部分。 

大体上，求职者应聘 PM 职位时，面试官主要考察以下几个方面。 

□ 处理含糊 情况： 虽然它不是面试中最重要的考察面，但你要明白面试官的确很看重此技 
能 3 他们想看到你面对含糊情况不会手忙脚乱、不知 所措； 希望看到你迎难而上，比如 
寻找新的信息、优先考虑最重要的模块，并以有条理的方式解决问题。面试官一般不会 
直接考察你这方面的能力（但也不排除这种可能性)，不过他们可能会根据你在处理问题 
时的表现对你进行评估。 

□以客户为中心（态度层 面）： 面试官希望看到你能做到以客户为中心。你是会照搬自己 
的经验主观臆测客户使用产品的方式，还是会站在客户的立场来了解他们希望如何使用 
产品？诸如“为盲人设计一款闹钟”的面试題考査的正是这个方面。当你听到这类面试 
题时，务必多提问题以了解产品主要面向哪些客户，以及他们会如何使用该产品。本书 
“测试” 一节有很多相关内容可供参考。 
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□ 以客户为中心（技术层 面）： 有些团队做的产品功能非常复杂，要求 PM 求职者必须充分 
掌握相关产品，因为等到工作时再上手是来不及的。欲在 MSN Messenger 团队中谋得 PM 
一职，也许不一定要精通即时通讯工具，而从事 Windows Security 工作则可能要求你具备 
扎实的计算机安全功底。因此，除非掌握了必备技能，否则在面试之前你还是三思而后 
行吧！ 

□多层次交流 能力： PM 需要跟公司内各个级别、跨部门跨职能人士打交道。所以，面试官 
会希望你具备多层次交流能力。这方面的考査非常直接，比如，面试官会抛出类似“向 
你的祖母解释什么叫 TCP / IP ” 的问题。当然，从你如何描述此前的项目经历，他们也能 
看出你的沟通能力。 

□ 对技术的 热情： 快乐工作的员工往往是高产员工，所以公司要确保你喜欢并享受这份工 
作。在你的回答中.应该处处展示自己对技术的热情，同时.要是能对公司或 N 1 队充满 
热情就更好了。面试官可能 会直接问你： “为什么想来微软工作？"此外，他们也乐于见 
到你充满激情地描述自己此前的工作经历和遇到过的挑战，而试官喜欢那些不惧挑战并 
迎难而上的求职者。 

□ 团队合作/领导 能力： 这大概适 PM 面试中最敏要的方面，无疑也是这份 「.作 本身的关键所 
在。所有面试官都会评估你能否与其他人合作无间 u 他们常会提出这类 问题： “说说你怎 
么处理 w 队成员没能按进度完成 n 作的怙况。"此外，面试官也想了解你能否妥禅处理冲 
突、是否积极主动、是否了解你身边的人，以及人们苒不宮欢与你共亊。你在“行为问 
题”上所做的准备在这里躭显得尤为®要。 

以上这些方面都是 pm 的必备技能，因此也是面试的重点。各个方面的权重大致取决于你应 
聘的 pm 职位以及该职位具体看重哪些方面， 

3.4 技术主管与部门经理 

某本上，技术主管职位都要求具备很强的编程技能，部门经理职位往往也不例外。如果这份 
T . 作需要编写代码，那你就必须具备很强的编码技能和算法功底一要求不比普通开发人员低。 
特别是谷歌，在编程上，对部门经理的要求很高。 

此外，你还要做好以下准备。 

□团队合作/领导 能力： 任何担任管理类角色的人都必须懂得团队合作，并能领导员工。面 
试官会或明或暗地考察你是否具备这些能力。一方面，他们会直接询问你在此前工作中是 
如何处理冲突的，比如你与主管意见相左的 时候； 另一方面，面试官也会暗中观察你怎么 
与他们互动。如果你的态度过于傲慢或太顺从，那他们就会认为你不太适合当管理人员。 

□把握轻重 缓急： 管理人员经常要面对层出不穷的状况，比如怎样才能确保团队在即将到 
来的截止期前完成工作。你需要充分展示你在一个项目中分得清轻重缓急，砍掉无足轻 
重的部分。把握轻重缓急意味着要通过正确的提问来掌握哪些方面至关重要，以及合理 
预估出都能实现哪些方面。 
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□沟通 能力： 管理人员不仅需要与上下级沟通，而且可能还会与客户或其他不太懂技术的 
人进行交流。面试官希望看到你具备与各种人打交道的能力，跟他们沟通起来游刃有余。 
实际上，面试官也是在拐弯抹角地评估你的个性。 

□ “把事情做好”的 能力： 经理与主管最重要的职责也许就是“把事情做好”。这意味着你 
要在项目准备和具体实施之间达成适当的平衡。你需要掌握如何组织项目，以及如何激 
励员工，从而达成团队目标。 

最终，这些方面大都会跟你的过往经验和个性关联起来。务必利用“面试准备表格"做好充 
分准备。 

3.5 创业公司的面试 

创业公司 （ start - U p ) 的职位申请和面试流程 T •差万别。我们没办法述及每一家创业公司的情 
况，好在还能列举一些共通之处。不过，也请理解，实际情况可能会有所不同。 

1. 职位申请 

很多创业公司都会在网上发布招聘启亊，但对于那些最热门的创业公司，最好的申请方式是 
通过内部推荇。这个推荐人不必非得是你的密友或同事 u 你可以四处撤网，向认识的人表达自己 
的意向，然后也许有人会傘起你的简历看看你是不是合适人选。 

2. 签证与工作许可 

很遗憾，美 H 大多数小型创业公司没有能力为你申请 X 作签证。他们跟你一样痛恨劳 I :部教 
条的制度，可还是无能为力。如果你没有合法身份，同时乂想到创业公司工作，也许最好的选择 
就是找-家为创业 公司输 送人才的专业人力资源代理机构，又或者，你可以盯着那些规模较大的 
初创公司。 

3. 简历筛选因素 

创业公司需要的 T 程师不仅要聪明过人,会写代码，而且同时也能在创业环境中卖力地工作。 
你的简历应该展示这些特质。 

此外，你还必须充满干劲，积极做到 最好； 这些创业公司急需立马能上手干活的员工。 

4. 面试流程 

与大公司注重你在软件开发上的整体职业素养相比，创业公司更注重你的个性契合度、技术 
技能和此前的工作经验。 

□个性契 合度： 面试官会通过你与他们的互动来评估你的个性契合度。请注意，与面试官 
交流时要友善、专注，这会给人留下好印象，从而获得更多工作机会。 

口技术 技能： 创业公司需要立马能上手干活的人，因此非常看重你在特定编程语言上的能 
力。如果你恰好掌握该公司使用的编程语言，请务必好好准备与此相关的各种细节问题。 
□ 以往 经验： 创业公司会问你很多以往工作经验有关的问题，请特别关注“行为面试题” 
一章。 

除此之外，你还会碰到这本书中提及的很多编程及算法问题。 
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曲试之前 


□ 积累相关经验 

□ 构建人际网络 

□写好简历 

4.1 积累相关经验 

录用与否主要取决于你在面试中的表现，而简历和过往经验则决定你有没有面试机会。你应 
该想方设法提升 A 己的技术 （ 及非技术）水平。不管是应届毕业生还是专业人士，拥有额外的编 
程经验都会让你受益匪浅。 

在校生可以采取下面这些举措。 

□选修有大作业的 课程： 如果你还是学生，请不要避开那些有大作业的课程。将来，你可 
以把这些项目经历都写在简历上，这会大幅提高得到顶尖科技公司面试机会的几率。当 
然，这些项 H 与实际情况联系越紧密，效果就越好。 

口找一些实习生 工作： 就算你是大学新生，也有机会得到相关的专业经验。大 一 、大二的 
学生可以考虑参加诸如“微软探索者”和“谷歌编程夏令营”这样的活动。如果得不到 
类似的机会，进人创业公司历练一下也不错。 

□开拓一些业务或 项目： 绝大多数公司都青睐富有创业精神的人。此举不仅可以培养一些 
技术经验，而且同时也能展示你的主观能动性和把事情做好的能力。你可以利用周末和 
休息时间写个软件。要是认识学校教授，不妨试着请他予以"资助”，以便你将自己的工 
作变成一项独立研究。 

另一方面，专业人士可能早已累积好相应资本，准备跳槽进人他们梦寐以求的公司。比如， 
谷歌的开发人员可能已经攒够经验，有机会跳槽到 Facebook 工作^不过，如果你想从不知名的小 
公司跳到科技巨头公司，或者从测试岗位转成开发人员，请参考以下这些建议。 

□多 承担一 些编程 职责： 在不透露跳槽意向的前提下，你可以向经理表达自己想在编程上 
接受更大的挑战。尽可能地参与一些重大项目，并多多使用对自己以后有利的技术，将 
来它们会成为简历上的亮点。另外，简历上也要尽量多列举这些与编程相关的项目。 
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□善用晚上和周末的闲暇时光：如有空闲时间，可以试着构建一些手机应用、网页应用或 
桌面软件。这样，你就有机会接触到时下流行的新技术，从而更契合科技公司的要求。 
这些项目经验都可以写到简历上，没有什么比“为兴趣而工作”更能打动招聘人员的了。 
总而言之，公司最青睐的人才必须具备两大 特性： 一是天资聪颖，二是扎实的编程功底。要 
是你能在简历上充分展示这两点，面试机会就唾手珂得了。 

此外，你应当提前规划好职业发展路径。如果打算转型成为管理者，哪怕当下应聘的仍是开 
发岗位，也应现在就想方设法培养自己的领导才能。 

4.2 构建人际网络 


你或许听说过很多人靠朋友推荐找到丫好工作。不过，你可能想不到，还有更多人是通过朋 
友的朋 友找到 n 作的。这真的很有道理。用极客的话来说，你有 at 个朋友，也就意味着你有/ V 2 个 
朋友的朋友。 

那么.在你找工作时这个数字意味者什么呢？这意味着，不管是直接联系人还是拐弯抹角的 
关系，对你找工作都很有帮助。 

1. 什么叫好的人际网络 

好的人际网络不仅意味着你广交朋友 （ 广度），还要与他们保持紧密的联系 （ 深 度)。 这句话 
看似矛盾，实则要辩证地看待。 

□广 度： 你的人际网络中不仅要有业内技术人士. IWR 最好还能涵盖各行各业的人才。比 
如说.结交一位会计朋友会对你的职业生涯帮助很大，因为他很可能在其他领域有很多 
朋友。冇时候，其中有些人可能就想认识像你这样的技术人才。请抱着开放的交友态度 
去对待他人。 

□深 度： 通过自己的密友来结交新朋友是个不错的方法，总好过让+太熟的人为你牵线搭 
桥 u 此外，人们会对那些所谓的"老油条”和“交际花”避之唯恐不及，觉得这些人太 
虚伪了。因此，尽量与朋友保持真诚和深厚的关系。 

其中的微妙之处就在于找到平衡点，你认识的人当然越多越好，但要确保自己待人真诚、开 
放。如果只是热衷于收集大家的名片. sp 你最终往往只会一无所获。 

2. 如何构建坚实的人际网络 

有些人认为，我们应当走出家门，去结识更多人。这么说也有道理。但是去哪里呢？而且， 
如何才能将“点头之交”发展成好朋友呢？ 

以下这些建议或许能给你一些启发。 

(1) 通过 Meetup . comii 样的社交网站或校友网来获取你感兴趣的活动资讯。记得带上你的名 
片。如果你暂时没有工作或还是学生，那就自己印些名片。 

(2) 主动跟人打招呼。也许你生性胆怯，不敢迈出这第一步。但请相信我，没人会拒绝你的 
友好之举，甚至有些人还会欣赏你的自信。话说回来，最坏能坏到什么地步呢？他们不喜欢你， 
不会与你结交，从此和你老死不相往来吗？ 
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(3) 大大方方地聊你的兴趣，并和人们谈论他们的兴趣。如果他们正在运营创业公司，或是 
从事其他你也感兴趣的活动，不妨邀请他们一起喝咖啡继续畅谈。 

(4) 活动结束后，你可以在 Linkedln 上把他们加为好友，或者给他们发邮件。当然，更好的方 
式就是邀请他们一起喝咖啡，这样你们就会有充足的时间来畅谈他们的创业公司，或是双方都感 
兴趣的 话题。 

(5) 最重要的是乐于助人。经常助人一臂之力，你就会给人留下慷慨大方.友好和善的印象。 
那些乐善好施的人往往也会得到更多帮助。 

切记，不要只局限于现实生活中的社交。在这个信息爆炸的时代，社交还可以拓展到网络上， 
通过博客、微博、 Facebook 和电子邮件结交朋友。 

当然，也不要太“走火人魔”沉迷于在线社交，你得努力建立实实在在的人际关系。 

4.3 写好简历 

简历筛选标准与面试标准并无太大差别，也是看你是否乂聪明乂会写程序。 

这意味着你在准备简历时应该突出这两点提到 A 己喜 欢打网球、旅游或玩魔法牌可没 
什么川,，/ I :罗列这类无关紧要的爱好之前，务请三思，宝贵的篇幅应该用来展示自己的技术 
才能。 

1. 简历篇幅长度适中 

在美国，人们会建议工作经验不足丨0年的求职者将简历压缩成 一页； 超过10年的，至多用两 
页。为什么呢？主要有两大理由。 

□招聘人员浏览一份简历一般只会用20秒钟左右。要是你的简历言简意賅恰到好处，招聘 
人员一眼就能看到。废话连篇只会 模糊® 点.扰乱招聘人员的注意力。 

□ 有拽人遇上冗长的简历连看都不看。你真的想胃这个风险， ih 别人直接扔掉你的简历吗？ 
如果看到这里你还在想，我 T . 作经验太丰富 r , 一 页篇幅根本放不下怎么办？相信我，你可 
以的。一开姶大家都会这么说。其实，简历写得洋洋洒洒并不代表你经验丰富，反而只会显得你 
完全抓不住重点。 

2. 工作经历 

简历不是也不应该是关于工作经历的编年史。比如，卖过冰淇淋跟聪明与否或代码写得怎么 
样关系不大。你应该只列举那些相关的工作经验。 

• 列举要点 

在描述工作经历时，请尽 M 采用这样的 格式： “使用 Y 实现 fx , 从而达到了 Z 效果，比如， 
下面这个 例子： 

□ “通过实施分布式缓存功能减少了75%的对象渲染时间，从而使得用户登录速度加快 
Tio % 0 " 

下面还有一个例子，描述略有 不同： 

□ “实现了一种新的基于 windifiW 比较算法，系统平均匹配精度由 1.2 提升至1.5。” 
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尽管不是所有经历都能套用此句型，但原则 无二： 描述做过的事情、怎么做的，以及结果如 
何。理想的做法是尽可能地量化 结果。 

3. 项目经历 

在简历中列出“项目经历”这一部分会让你看起来很专业。对于大学生和毕业不久的新人尤 
其如此。 

简历上应该只列举2到4个最重要的项目。描述项目要简明扼要，比如使用哪些语言和技术。 
你也可以加上一些细节.比如该项目是个人独立开发还是团队合作的成果，是某一门课程的一部 
分还是自主开发的。当然，这些细节不一定放到简历上，除非能让简历更出彩。 

项目也不要列太多。很多求职者就犯过这样的错误，在简历上一股脑儿列出先前做过的13 
个项目，鱼龙混杂，效果反而不佳。 

4. 编程语言和软件 

• 软件 

一般说来，“熟悉微软 Office ” 之类不必列人简历。这应该是地球人的必备技能，列出来反而 
会模糊重点。你应该列出那些能反映自身技术水平的软件或系统（比如 Visual Studio 、 Linux 等), 
不过坦白说，这么做用处也不大。 

• 編 裎语言 

列举编程语言确实是件 难事。 我们到底应该列出自己用过的所有语言，还是只列那些用得最 
顺手的语言呢？我建议采用下面这个折中 办法： 列出你用过的主要语言，后面加上熟练程度。比 
如像下面这样： 

□ 编程 语肓 ： Java ( 非常熟 练）， C ++ ( 熟练 ）， JavaScript ( 有过使用经验)。 

5. 给母语为非英语的人及国际人士的建议 

一些公司可能会因为小小的笔误就扔掉你的简历，所以请至少找一位以英语为母语的人来帮 
你审阅简历。 

此外，申请美国的工作时.简历中不要包含年龄、婚姻状况或国籍等。公司并不想看到这些 
个人信息，因为怕惹上不必要的麻烦。 
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□ 准备工作 
□ 如何应对 

5.1 准备工作 


行为面试题的考察有各种各样的原因。人们 BI 以通过这些问题来了解你的个性，或是更深人 
地掌握你的履历，又或者缓和一下面试的紧张气氛。不管怎样，这个部分很重要.而且有办法做 
好准备、有的放矢。 


准备工作 


行为面试题一般是这么 问的： “说说你曾经……”面试官可能还会要求你列举并说明具体的 
项目或岗位。我建议你先按如下格式拟定一份“准备表格 "： 






































第一行可以列举你在简历中提到的主要事项，比如项目、职位或活动。第一列应该写一些常 
见 问题： 你最享受和最不喜欢的过程、最难的部分、从中学到的经验、最难解的 bug , 等等。然 
后，在对应单元格里写下相应的小故事。 

当面试官问及项目有关的问题时，你就能回想起这些小故事，从容应对。记得在面试前复习 
这份表格。 

另外，建议大家将小故事浓缩成几个关键字，以便填到单元格里。这样一来，这份表格用起 
来就会更顺手，方便记忆。 
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电话面试时，最好将这份表格摆在自己跟前。把每个小故事都概括成几个关键字，更容易记 
忆，自然而然就能把整个故事串起来，比死记硬背一段文宇要轻松得多。 

你还可以将这份表格扩展成一系列“软问题”，比如团队冲突、项目失败的经历以及你需要 
说服团队成员的事例。对于那些不是专职开发的职位如技术主管、 PM 或测试人员而言，这些都 
是很常见的面试问题。如果你刚好要申请其中一个职位，建议你针对这些“软问题”再准备一份 
表格。 

在冋答问题时，你不只是在讲述一个与该问題密切相关的故事，更是在向别人展现自我。所 
以，诮用心思索每个故事都能体现出自己的哪些特性。 

1. 你有哪些缺点 

被问及自己有哪些缺点时，回答不要太空泛！ m 如“我最大的缺点就是 工作太 努力了"的冋 
答.反而会显得你傲慢 ft 大，并且不愿止:视自己的不足。没有人苒欢与这样的人共事。因此，你 
应该提到真实、合乎情理的缺点，然后话锋一转，强调自己如何克服这些缺点。 比如： “有时候， 
我可能对细节不够重视。好的•面是我反应迅速、执行力强，但不免会粗心大意而犯错。有鉴于 
此，我总是会找其他同亊帮忙检査自己的工作，确保不出问题， 

2. 项目中最难处理的问题是什么 

当面试官问到这个问题时，请不要泛泛地冋答“我得学习很多新的编程语言和技术”。除非 
你实在是无话可说，否则这种回答似乎是在 强调： 该项目并不是很难.没什么 棘于的 问题。 

3. 你应该问面试官哪些问题 

大多数面试官都会给你提问的机会。有意无意间，你提问的质录也会成为他们评估你的整体 
表现的因索之一。 

也许你会在面试过程中临时想到若干问埋，但你还是可以并且应该亊先准备好问题。对公司 
和团队做些调研，有助于你准备问题。 

问题可以分成以下三大类。 

• 真实的问題 

也就是你真的想知道答案的问题。下面是对多数求职者有用的一些问題点。 

(1) “你每天有多少时间花在写代码上？” 

(2) “你一周要开几次会？” 

(3) “整个闭队中，测试人员、开发人员和项目经理的比例是多少？他们是如何互动的？团队 
怎么做项目规划？" 

这些问题有助于你较好地了解公司的工作环境和日程安排。 

• 有见地的问題 

有见地的问题 nl 以充分反映出你的编程水平和技术功底，同时，还能显示你对该公司或其产 
品的兴趣。 

(1) “我注意到你们使用了 X 技术，请问你们是如何处理 Y 问题的？” 

(2) “为什么你们的产品选择使用 X 协议而不是 Y 协议？据我所知，虽然 X 有 A 、 B 、 C 等几大 
好处，但因为存在 D 问题，很多公司并未采用该协议。” 
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只有事先对该公司做过充分调研，才问得出这类有深度的问题。 

• 富有激情的问题 

这些问题旨在展示你对技术的热忱。要让面试官知道你热衷学习，将来能为公司的发展做出 
很大贡献。比如： 

我对可扩展性很感兴趣。请问你从事过分布式系统方面的 T 作吗？有哪些机会可以学习 
这方面的知识？" 

(2) “我对X技术不是太熟悉，不过听上去是个不错的解决方案。你能给我多讲讲它的工作原 
理吗？” 

5.2 如何应对 

如前所述，面试官喜欢在面试开始和结束时与你谈天说地或聊聊“软技能"。他们通常会就 
你的简历问些问埋，或者泛泛地提问，此时你也可以问一些和公司有关的问題。这个面试环节除 
了缓和气氛，也是意在了解你。 

冋答这类问题时，切记以下几个建议。 

1. 力求具体.切忌自大 

骄傲自大是面试大忌。可是，你乂想给面试官留下深刻的印象。那么，怎样才能很好地秀出 
自己的实力而又不显自大呢？那就是冋答问题要具体！ 

具体也就是只陈述事实，余下的留给面试官自己解读。请看下面这个例子。 

□ —号求 职者： “我几乎包揽了闭队中所有累活和难活。” 

□二号求 职者： “我实施 r 文件系统，因为 xxxx 等原因，这是整个项目中最难的一部分。” 
二号求职者的回答不仅听起来更令人印象深刻，而且也不会显得骄傲自大。 

2. 省略细枝末节 

当求职者就某个问题喋喋不休时.不熟悉该主@或项目的面试官往往听得一头雾水。所以， 
请酋略细枝末节，只谈重点。换言之，建议你这么 间答： “在研究最常见的用户行为并应用 
Rabin-ICarp 算法后，我设计了一种新算法，在90%的情况下搜索操作的时间复杂度由0(„)降至 
O(log/0 。 您要是感兴趣的话，我可以详细说明。”该冋答言简意赅，1点 突出； 要是面试官对实 
现细节感兴趣，他会主动询问。 

3. 回答条理清晰 

冋答行为面试题有两种常见的组织 方式： 主题先行法与 S_A.R •法 ® D 你可以分别或组合使用 
这两种技巧。 

* 主題先行 

主题先行即开门见山、直奔主题，冋答简洁明了。比如， 


① Rabin-Karp 算法是由 Michael O. Rabin 和 Richard M. Kaip 于1987年提出的字符串 KR 箅法。——译者注 

② S.A.R 即 Situation. Action 与 Result 的缩写.情景.行为与结果，一编者注 


行为面试題 _ 

□ 面 试官： “讲一讲你必须说服一群人作出大幅调整的事例。” 

□求 职者： “好的，我在学校提出过一个让本科生互相授课的想法，并成功说服学校采纳该 
建议。起初我们学校规定……” 

主题先行法可以快速抓住面试官的注意力，让他了解事情梗概。此外，假如你有滔滔不绝的 
倾向，这也有助于你不偏离主题.因为你早已开门见山地点明主旨。 

• S.A.R. 

S.A.R. 法是指先描述情景，然后解释你采取的行动，最后陈述结果。 

示例： “说说你与某位‘ 刺头’ 队友相处的事例， 

□情 采： 在操作系统课的大作业中，我被安排与其他三个人合作。其中两人都很卖力，但 
另外一个人做的不多。开会时他总 是沉畎 寡言，也极少参与邮件讨论，只是很吃力地完 
成分配给他的模块。 

口 行动： 有一天课后，我把他拉到一边讨论这门课程，然后谈起我们的大作业。我坦诚地 
询问他对大作业的感受，以及他最感兴趣的模块。他建议让他处理最简单的几个模块， 
并承诺会完成 ft 后的总结报告。我意识到他其实一点都不懒一他只是对这项大作业感 
到很闲惑，并且缺少自信心。此后，我开始与他合作，进一步细分组件模块。此外，在 
工作中我还经常称赞他以增强他的 ft 信心。 

口 结果： 他依然是我们团队最弱的一员，但是进步很大。他及时完成了分配给自己的任务， 
参与讨论也更积极。后来在另一个大作业中，我们合作得非常愉快。 

切记，描述情累与结果务必言简意賅。面试官一般不需要太多细节就知道来龙去脉，实际上， 
细节过多反而会令他们換不着头脑。 

采用 S.A.R. 法简明扼要地描述情景、行动和结果，可让面试官快速了解你是如何施加影响的， 
起到了什么作用。 
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技术面试题 


□技术准备 
口如何应对 
口箅法题的五种解法 
□ 怎样才算好代码 

6.1 技术准备 

既然你买了这本书，说明你已经为技术面试做了不少准备。千得好！ 

即便如此，准备方式也有好有坏。许多求职者只是通读一遍问题和解法，囫囵吞枣。这好比 
试图单凭看问题和解法就想学会微积分。你得动手练习如何解题。单靠死 C 硬背效果不彰。 

1. 如何练习 

就本书的面试题（以及你可能遇到的其他题目），请参照以下几个步骤。 

(1) 尽置独立解题。也就是说，要试着实战演练解题过程。许多题 B 确实很难，但是没关系， 
不要怕！此外，解题时还要考虑空间和时间效率。多问问自己，能否通过降低空间效率来提高 
时间效率，或者相反。 

(2) 在纸上编写算法代码。之前你一直在计算机上编写代码，习 惯了由 此带来的诸多便利。 
不过，在面试中，你可享受不到语法高亮、代硏补全或编译构建的种种好处。不妨在纸上编写代 
码模拟面试时的情景。 

(3) 在纸上测试代码。也就是要在纸上写下一般用例、基本用例和错误用例等。面试中就得 
这么做，因此最好提前做好准备。 

(4) 将代码照原样输入计算机。你也许会犯一大堆错误。请整理一份清单，罗列自己犯过的 
所有错误，这样在真正的面试中才能牢记在心。 

此夕卜，模拟面试 （mock interview ) 也非常有用。 CareerCup . com 提供了与微软、谷歌和亚马 
逊等公司员工进行模拟面试的机会，当然，你也可以跟朋友一起演练，轮流当面试官给对方做模 
拟面试。你的朋友不见得受过什么专业训练，但至少还能带你过一遍编码或算法面试题。 

2. 你需要掌握的知识 

大多数面试官都不会问你二叉树平衡的具体算法或其他复杂算法。老实说，离开学校这么多 
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年，恐怕他们自己也记不清这些算法了。 

一般来说，你只要掌握基本知识即可。下面这份清单列出了必须掌握的 知识: 


戣据结构 

算 法 

槪 念 

链表 

广度优先搜索 

位操作 

二叉树 

深度优先搜索 

单例设计模式 

单同査找树 （ trie ) 

二分査找 

工厂设计模式 

栈 

归并株序 

内存 （ 栈 和堆〉 

队列 

快速排序 

递归 

向量/数组 列表 

树的 插入/査找等 

大 C ) 时间 

敗列表 




对于上述各项主题，务必掌握它们的具体实现和用法、应用场景、空间和时间复杂度如何等。 
对于其中的数据结构和算法，你还要练习如何从无到有地实现。面试官可能会要求你宜接实 
现一种数据结构或算法，或者对其进行修改。不管怎样，你越是熟悉具体实现，把握就越大。 
其中，散列表一项特別重要。你会发现.解决面试问题时，经常会用到散列表。 

3. 2的幕表 

有些人已经把下面这张表背得滚瓜烂熟，如果你还没有的话，面试前•定要背下来。回答可 
扩展性问题时，这张表用处很大，借助它可以 快速算 出一组数据占用多少空间。 


2的幂 

准碥值（ X ) 

近似值 

X 字节转换成 MB 、 GB 等 

7 

128 



8 

256 



10 

1024 

— 

1 K 

16 

65 536 


64 K 

20 

1 048 576 

一百万 

1 MB 

30 

1 073 741 824 

十亿 

1 GB 

32 

4 294 967 296 


4 GB 

40 

1 099 511627 776 

一万亿 （ trillion ) 

1 TB 


有了这张表，就可以做速算。例如，一个将每个32位整数映射为布尔值的散列表可以把一台 
计算机的内存填满。 

在接受互联网公司的电话面试时，不妨将这张表放在跟前，也许能派上用场。 

4. 需要知道 C++、 Java 或其他编程语言的细节吗？ 

我个人不会问这类问题（比如“什么是虚函数表”)，不过许多面试官确实会问。 

对于微软、谷歌和亚马逊等大公司，我不太担心这些问题。如果你在简历上提到自己熟悉某 
种语言.那你自然应该掌握这种语言的基本概念。不过，我还是建议你在数据结构和算法方面多 
下工夫。 
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参加小公司和非软件公司的面试，这些问题可能更显重要。在 CareoCup . com 上搜索你心仪 
的公司再作决定。如果找不到那家公司，那就找一家类似的公司作为参照。一般而言，创业公司 
更看重与他们使用的编程语言相关的技能。 

6.2 如何应对 

面试绝非易事。要是没能立刻答出所有问题或某个问题，也没关系！实际上，根据我的经验， 
在我面试过的120多人中，大概只有10个人能立即答上我经常问的问题。 

因此.碰到棘手的问题，不要慌张。只管大声说出你准备怎么 解决- 向面试官说明你会如何 
处理这个问题，这样面试官就不会误以为你被难住了。 

另外，还有 一点： 只有面试官点头认可，你才算是真正解决了问题！我指的是，在给出算法 
后，你就要开始考虑它可能存在的问题。边写代码.边査缺陷。如果你和我面试过的其他110名 
求职者一样，那就免不了要犯一错误。 

解决技术面试题的五步法 
解决技术面试题可采取下面的五步法。 

(1) 向面试官提问，以消除疑义。 

设计一种算法。 

(3) 先写伪码，但务必告诉面试官接下来会写“真实的”代码。 

(4) 写代码要不紧不慢。 

(5) 测试写好的代码，仔细修正每一处错误。 

下面我们将逐一探讨上述五个步骤。 

第 一步： 提问 

技术面试题看似清晰明确实则模糊不淸，因此务必多提问题以澄清所有存疑之处。问到最后， 
你可能会发现，这个问题与你最初预想的截然不同——也许更难，也许更简单。实际上，许多面 
试官 （ 尤其是微软的）会特意考察你能否提出好问题。 

好问题大概是这样的 ：数据 类型是什么？有多少数据？解决这个问题需要什么假定条件？用 
户都是谁？ 

示例： “设计一种列表排序算法。” 

口 问题： 具体是哪种列表？数组还是链表？ 

回答： 数组。 

口 问题： 数组里存放的是什么？数字、字符、还是字符串？ 

冋答： 数字。 

□ 问题： 这些数字都是整数吗？ 

回答： 是的。 

□ 问题： 这些数字来自何处？是身份证号码还是别的什么数值？ 

回答： 顾客年龄。 
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□ 问题： 总共有多少顾客？ 

回答： 大概一 百万。 

现在我们要解决一个与最初理解很不一样的 问题： 对一个包含一百万个整数的数组进行排 
序，这些整数在0到 130( —个合理的最高 年龄） 之间。该怎么解决这个问题呢？只需创建一个包 
含13#元素的数组，然后计算每一个元素出现的次数。 

第 二步： 设计算法 

算法的设计可能会很难，不过下一节的“算法题的五种解法”可以帮上大忙。在设计算法时， 
记得问问自己以下几个 问题： 

□ 该算法的空间和时间复杂度如何？ 

□ 碰到大量数据会怎么样？ 

□你的设计会引发其他问题吗？例如，你设计了一种二叉査找树的变体，那么该设计是否 
会影响插入、査找或刪除时间？ 

口如果还有其他问题或限制，你会做出正确的取舍吗？对于哪些场景，这一取舍可能不是 
最优的？ 

□ 如果面试官揞定特定数据（例如，前面提到待处理数据是年龄值，或按一定顺序排列的）, 
你能否善用该信息？而试官给你特定信息往往是有原因的。 

先给出蛮力解法，这么做当然是允许的，甚至推荐这么做。然后，在此基础上不断优化。很 
显然，面试官总是期望你能给出尽可能最优的解法，但这并不意味着一开始就得给出完美无瑕的 
答案。 

第 三步： 编写伪码 

先写伪码有助于你理清思路，减少犯错的次数。不过，务必先跟面试官打声招呼，你会先写 
伪码， 紧接着就会编写"真实的"代码。许多求职者选择写伪码，意在“逃避”编写真实代码， 
你肯定不愿与那些求职者为伍。 

第 四步： 编写代码 

编写代码不要太 仓促； 实际上，太仓促很可能会害了你自己。写代码时只管放松步调，做到 
有条不紊，丝丝人扣。另外，切记以下忠告。 

□多用数据 结构： 根据实际情况选用合适的数据结构，或者自己定义数据结构。例如，有 
个面试题涉及从一群人中找出年龄最小的，不妨考虑定义一个数据结构 Person 表示一个 
人。这样也能展现出你注重良好的面向对象设计。 

□ 写代码不要太 杂乱： 这看似小事一桩，实则很重要。在白板上写代码时，尽量从左上角 
而不是中间开始写。这样才有足够的地方从容答题。 

第 五步： 测试 

没错，自己写的代码自己测试！考虑测试以下用例。 

口极端用例： 0、负数、空值 （ mill )、 最大值、最小值。 

□ 用户 错误： 用户传人空值或负数会出什么问题？ 

口 一般 用例： 测试正常用例。 
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如果你的算法很复杂或涉及大量数值操作（移位、算术运算等），建议边写代码边测试，而 
不是写完代码再测试。 

发现错误时（这是难免的），务必先弄清楚出现缺陷的原因再作修改。你肯定不希望6己在 
面试官看来像只热锅上的蚂蚁一样团团乱转，这里修修那里补补。举个例子，我就碰到过这样的 
求职者，他发现函数碰到某个特定值返回 true 而非正确的 false , 于是直接修改返回值，接着验 
证函数能否工作。这或许可以修正那种特定情况下出现的问题，但无疑又会滋生新的问题。 

当你察觉代码中存在的问题时，务必三思而后改，先理清代码失效的原因。这样你才能写出 
既漂亮又整洁的代码，也会越写越快。 

6.3 算法题的五种解法 

要解决棘手的算法问题，世上没有什么不二法门，不过下面介绍的几种方法可能管用。常言 
道熟能生巧，题 S 练习得越多，就越容易确定该采用哪种方法来解决问题。 

另外，下面这五种方法可以“混搭”使用。也就是说，施以“简化推广法”后，还可以接着 
尝试“模式匹配法' 

方 法一： 举例法 

我们先从你可能熟悉的“举例法”开始，也许你从未听过这种叫法。“举例法”是先列举一 
些具体的例子，看看能否发现其中的一般规则。 

示例： 给定一个具体时间，计算时针与分针之间的角度。 

下面以3点27分为例。确定3点的时针位置和27分的分针位置，我们可以 imi 出一个时钟。 

在下面的解法中，示小时， m 表示分钟。同时，我们假定 A 的范闱是0〜23。 



从这些例子可以得出以下规则。 

□分针的角度（从12点整开始算 起）： 360 x w /60； 

□ 时针的角度 （ 从 12点整开始算起 ）： 360 x (A % 12) /12 + 360 x ( m /60) x (1 / 12)； 

□时针和分针之间的 角度： （时针的角度的角度)％ 360。 

简化上述式子可以得到 (30 A - 5.5 m )% 360。 

方 法二： 模式匹配法 

模式匹配法是指将现有问题与相似问题作类比，看看能否通过修改相关问题的解法来解决新 
问题。 

示例： 一个有序數组的元素经过循环移动，元素的颀序可能变为 "34567 1 2”。 怎样才能 
找出数组中最小的那个元素？假设数组中的元素各不相同。 
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这个问題和下面两个问题有点 类似： 

□ 在一个无序数组中找出最小的 元素； 

□ 在一个有序数组中找出某个特定的元素 （ 比如，通过二分査找法)。 

* 处理方法 

在无序数组中査找最小元素的算法没多大意思 （ 只要遍历所有元素即 可）， 同时它也没有利 
用给定信息 （ 即这是一个有序数 组）， 因此这个问题帮不上什么忙。 

然而，二分査找法就非常适合。我们知道，这是个有序数组，只是一部分元素循环移动过。 
因此元索排序肯定是从小到大，在某一位置突然变小，接着又开始从小到大排列。那个“转折点" 
正是最小的元素。 

比较中间元素与末尾元素 （ 6和2 ), 由于 MID > RIGHT , 珥以确定这个转折点就在这两个元 
素之间。这不符合从小到大的排列顺序，故而表明转折点就在其中。 

如果 MID 比 RIGHT 小，则说明转折点要么在前半部分，要么根本不存在（此数组严格按照从 
小到大排 序)。 不管怎样，我们都可以找到 M 小的元素。 

我们可以继续运用这个方法，将数组逐步二分进行査找，最终找到最小的元素(或是转折点)。 

方 法三： 简化推广法 

采用简化推广法，我们会分多步走。首先，我们会修改某个约束条件，比如数据类 S ! 或数据 
设，从 Iftl 简化这个问题。接着，我们转而处理这个问题的简化版本。最后，一旦找到解决简化版 
问题的算法，我们就可以基于这个问题进行推广，并试着调整简化版问题的解决方案，让它适用 
于这个问题的复杂版本。 

示例： 从一本杂志里剪下一些单词可以拼凑成一封勒索信。怎样才能断定勒索信（以字符串 
表示）是否由某本杂志（即另一个字 符串〉 里的单词组成？ 

我们可以先这样简化 问埋： 暂时不考虑单词.只当它是字符。也就是说，假设我们从杂志里 
剪下一些字符拼成了这封勒索信。 

接着，我们只需新建一个数组并数出字符的数 M , 即可解决这个简化后的勒索信问题。数组 
中的每个元素对应一个字母。首先，我们数出每个字符在勒索信中出现的次数，然后再遍历整本 
杂志，确认它是否包含勒索信上的全部宇符。 

推广这个算法时，具体做法和上面的差不多。只不过这一回，我们不再创建包含字符计数的 
数组，而是创建一个散列表，将单词映射到其词频上。 

方 法四： 简单构造法 

对于某些类型的问题，简单构造法非常奏效。使用简单构造法，我们会先从最基本的情况（比 
如《 = 1 ) 来解决问题，一般只需记下正确的结果。得到《 = 1的结果后.接着设法解决《 = 2的情 
况。接下来，有了”=1和》= 2的结果，我们就可以试着解决 n = 3的情况了。 

最后，你会发现这其实就是一种递归算法~~ 知道; V -1 时的正确结果，就能计算出 M 付的结 
果。有时，只有等到算出; V 为3或4的结果，我们才能从中找到规律，基于前面的结果解决整个 
问题。 
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示例： 设计一种算法，打印某个字符串所有可能的排列组合。为简单起见，假设字符串中没 
有重复字符。 

以字符串 abcdefg 为例： 

只有的情况.结 果为： {" a ”} 

然后是 K ab ”. 结 果为： {" ab », " ba **} 

再然后是 " abc ”， 结果会是什么呢？ 

此时，问题开始变得“有点意思” 了。得到 P (" ab ») 的答案，怎么才能生成 P (" abc ») 呢？很 
简单，新字符是我们只需在前一种情况的答案也即字符组合的任意位置加一个 c 就可以了。 
也 就是： 

P (" abc ») -将字符插入 P (" ab ”) 得到的所有字符串的任意位置。 

亦即： P (“ abc ”） =将宇符插人这两个宇符串中的任意位置。 

也就是: P (" abc M ) = merge ({** cab M , " acb **, " abc **}, {" cba **, n bca M , " bac **}) 0 

最后得出 结果： P ( w abc *) - {" cab **, " acb ", " abc ”，" cba ", " bca ", " bac "}。 

既然掌握了其中的套路，我们就可以设计一个递归算法。要生成字符申 SP .. S 。 的所有排列. 
我们可以先“砍掉”最后一个字符，首先生成5 1 ...5„_ 1 的所有排列。得到所有排列的 
结果列表之后，我们会循环遍历这个列表，并在每个字符串的任意位置插人 S n 。 

简单构造法最后往往会湞变成递归法。 

方 法五： 数据结构头脑风#法 

这种方法看起来有点笨，不过很管用。我们可以快速过•遍数据结构的列表，然后逐一尝试 
各种数据结构。这种方法很实用，闪为一旦找到合适的数据结构（比如说树），很多问题也就迎 
刃而解了。 

示例： 随机生成一些数字，并保存到一个（可扩展的）數组中。如何跟踪數组的中位数？ 

数据结构头脑风暴法的过程大致如下。 

□链表？恐怕不行一在数字的存取和排序上，链表往往效果 不佳。 

口数组？也许可以，不过你已经用了一个数组。你有办法让数组保持有序状态吗？这么做 
开销恐怕比较大。暂不考虑采用，必要的话， BI 以回头再试。 

口二叉树？倒也有可能，因为二叉树非常适合处理排序问题。实际上，如采这棵二叉树是 
完全平衡的，根结点可能就是中位数。不过，你要小心一如果它包含偶数个元素，那 
么中位数实际上是中间两个元素的平均值。而中间两个元素不可能都是根结点。因此， 
二叉树也许可行，我们待会再说。 

。堆？堆非常适合基本排序，跟踪最大值和最小值。堆其实也很有意思一只用两个堆，就顏 
踪较大的那一半元素和较小的那一半元素。较大的一半保存在小顶堆 （ minheap ) 中，其中最 
小元素位于堆顶。较啲一半则保存在大顶堆 （max heap ) 中，其中最大元素位于堆顶。现在， 
有了这残数据^构，整个数组的中位数很可能就是两个堆顶之。如果这两个堆大小不一样， 
你可以从元素较多的堆中弹出一并压入另1堆中，两个堆很快就能“重获平衡”。 
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切记，问题演练得越多，你就越容易判断该选用哪种数据结构。当然了，你也能更自如地从 
这五种方法中选出最管用的那种。 

6.4 怎样才算好代码 

至此，你也许明白了，许多公司都想找能写出“优美、整洁"代码的人才。但这到底意味着 
什么，怎样才能在面试中展现出这方面的能力呢？ 

一般说来，好代码具备如下特性。 

□ 正确：代码应当正确处理所有预期输人 （expected input >和非法输人 （unexpected input )。 
□髙 效： 不管是从空间上还是从时间上来衡量，代码都要尽可能地高效运行。所谓的“高 
效”不仅是指在极限情况下的渐近效率 （ asymptoticefficiency , 大 O 记法），同时也包括实 
际运行的效率。也就是说.在计算0时间时，你可以忽略某个常量因子.但在实际环境中， 
该常量因子可能冇很大影响。 

□ 简洁： 代码能写成10行就不要写成100行。这样开发人员才能尽快写好代码。 

□ 易读： 要确保其他开发人员能读懂你的代码，并弄清楚来龙去脉。易读的代码会有适当 
注释，实现思路也简单易慊。这就意味着.那些包含诸多位操作的花俏的代码不见得就 
是“好”代码。 

口可 维护： 在产品生命周期内，代码经过适气修改就能应对需求的变化。此外，无论对于 
原开发人员还是其他开发人员，代码都应该易于维护。 

力求实现上述特性必须找到一个平衡点。比如，有些情况下，我们往往要栖牲一定的效率好 
让代码史易维护，有时则要反其道行之。 

在面试中，写代码时应该好好考虑这些要素。下文就前面的清单给出更具体的描述。 

1. 多用数据结构 

假设面试官要求你编写一个函数，对两个简单的多项式求和，其形式为^+ ftc * +…（其中 
系数和指数为任意正实数或负实数），即多项式的每一项都是一个常量乘以某个数的 W 次幂。面试 
官还补充说，不必对这些多项式做字符串解析，可以使用任意数据结构来表示它们。 

这个函数有多种实现方式。 

• 最 差的实现方式 

最差的实现方式就是将多项式存储为一个 double 型数组，其中第元素对应的是多项式中 x * 
的系数。采用这种结构有一定问题，如此一来，多项式就不能含有负的或非整数指数。要想用这 
种方法来表示 x 1000 多项式的话，这个数组就得包含 10001' 元素。 

1 int[] sum(double[] polyl^ double[] poly2) { 

2 ... 

3 > 

• 较差的实现方式 

一种不算最差的实现方式是将多项式存为一对数组 coefficients 和 exponents 。 采用这种方 
法，多项式的所有项可以按任意顺序存放，只要系数和指数配对，多项式的第/项表示为 
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coefficients ^] * x exponentsI11 0 

采用这种实现方式，如果 coefficients [ p ] = k 和 exponents [ p ] = m , 则第 p 项为 fo "。 尽管 
这么做没有上面那种解法的限制，但还是很凌乱。一个多项式就要用两个数组记录。如果两个数 
组长度不同，多项式就会出现“未定义”值。而要返回多项式更是麻烦，因为一下子得返回两个 
数组。 

1 ??? sum(double[] coeffsl, doubled exponl, 

2 double[] coeffs2, double[] expon 2 ) { 


• 较好的实现方式 

对于这个问题，较好的实现方式是专为多项式设计一种数据结构。 

1 class PolyTenn { 

2 double coefficient; 

3 double exponent; 

4 } 

5 

6 PolyTermf] sum(PolyTenn[] polyl # PolyTer*[] poly) { 


有些人可能或真的认为这么做“优化过了头”。也许是，也许不是。不管你是不是这么认为, 
上面的代码都表明你应该用心思考如何设计代码.而不要匆忙地胡乱堆砌一通。 

2.适当*用代码 

假设面试官要求你编写一个函数检査某个二进制数 （ 以宇符串形式传人）是否等于以字符串 
表示的十六进制数。 

我们可以善用代码重用巧妙解决该问題。 


1 public boolean compareBinToHex(String binary. String hex) { 

2 int nl - convertToBase(binary, 2); 

3 int n2 - convertToBase(hex, 16); 

4 if (nl < 0 11 n2 < 0) { 

5 return false; 

6 } else { 

7 return nl ■■ n2; 


11 public int digitToValue(char c) { 

12 if (c >■ && c <= € 9*) return c - r 0 f ; 

13 else if (c >■ # A* && c <* r F # ) return 10 + c - e A*; 

14 else if (c >* && c <» return 10 + c - ， a ，； 

15 return -1; 



18 public int convertToBase(String number, int base) { 

19 if (base < 2 || (base > 10 && base != 16)) return -1; 

20 int value = 0 ; 
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21 for (int i = number.length() - 1 ; i >= 0 ; i--) { 

22 int digit = digitToValue(nunber.charAt(i)); 

23 if (digit < e || digit >= base) { 

24 return -1; 

25 > 

26 int exp = number.length() - 1 - i; 

27 value += digit * Math.pow(base, exp); 

28 } 

29 return value; 

30 } 

我们本可以实现两套代码，实现二进制数和卜六进制数的转换，但这么做只会加大代码的编 
写难度.而且维护起来也更难 。 相反，我们还是通过编写 convertToBase 和 digitToValue 的方法 
来重用代码。 


3. 模块化 

编写模块化代码是指将孤立的代码块划分为相应的方法（函数)。这有助于让代码更易读， 
可读性和可测试性更强。 

假设你在编写交换整数数组中的最大和最小元索的代码，不妨将全部代码写在一个函数里, 
如下所示： 

1 public void swapMinMax(int[] array) { 

2 int minlndex ■ 0 ; 

3 for (int i - 1; i < array.length; i-H-) { 

4 if (array[i] < array[ninlndex]) { 

5 minlndex ■ i; 

6 

7 

8 

9 

10 
11 
12 

13 

14 

15 

16 

17 

18 
19 

或者，你还可以采取更模块化的方式，将相对孤立的代码块隔离到对应的方法中。 

1 public static int getMinIndex(int[] array) { 

2 int minlndex = 0 ; 

3 for (int i = 1; i < array.length; i++) { 

4 if (array[i] < array[ninlndex]) { 

5 minlndex * i; 


int maxlndex » 0 ; 

for (int i - 1 ; i < array.length; i++) { 
if (array[i】> array[naxlndex]) { 
maxlndex - i; 


int temp = array[ninlndex]; 
array[minlndex] * array[maxlndex]; 
array[maxlndex] ■ temp; 
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11 public static int getMaxIndex(int[] array) 

12 int maxlndex ■ 0 ; 

13 for (int i = 1; i < array.length; i-f+) { 

14 if (arrayfi] > array[maxlndex]) { 

15 maxlndex = i; 


public static void swap(int[] _ 
int temp - array[m]; 
array[m 】 =array[n]; 
array[n] - temp; 


public static void swapMinMaxBetter(int[] array) 
int minlndex ■ getMinIndex(array); 

I int maxlndex = getMax!ndex(array); 

► swap(arrayj minlndex, maxlndex); 


M 然前面的非模块化代码希起来也不怎么精，们模块化代码的一大好处在于它易于测试，因 
为毎•部分都可以单独验证。随着代码越来越 fi 杂，编写模块化代码就变得越发重要。模块化的 
代码也更易阅读和维护。面试官希铝符到你能在面试中展现这些技能。 


4. 灵活、健壮 

不要因为面试官要求编写代码检査谁足〔连棋游戏的羸家，就非得假定它是一个 3 x 3 的棋盘。 
何不放手针对棋盘编写代码呢？ 

编写灵活、通用的代码，也可能意味着使用变 M , 而不是在代码里直接把值写死，或者使用 
模板/泛型来解决问题„要是有办法编写代码解决更普遍的问题，那我们就应该这么做。 

当然，它也有限制条件。如果通用解决方案更为复杂，并且在面试中几乎没有必要使用，那 
就按照要求解决相应的问题，效果可能会更好。 


5. 错误检查 

写代码很细心的人有一个明显的特征，那就是她不会想当然地处理输人信息。相反，她会用 
ASSERT 语句或讯吾句仔细验证输人数据是杏合理。 

比如，回到前面那段将基数为/的进制数 （ 比如基数为2或16 ) 转换成整数的代码。 


1 public int convertToBase(String number, int base) { 

2 if (base < 2 || (base > 10 && base != 16)) return -1; 

3 int value = 0; 

4 for (int i = number.length() - 1; i >* 0; i--) { 

5 int digit = digitToValue(number.charAt(i)); 

6 if (digit < 0 11 digit >* base) { 

7 return -1; 


int exp = number.length() - 1 - i; 
value += digit * Math.pow(base > exp); 
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12 return value; 

13 > 

在第2行，我们检査基数是否有效（假定除16外，大于10的基数都是无效的，没有标准的字 
符串表示形式)。在第6^,我们另加了一处错误 检査： 确保每个数字都落在允许范 围内。 

诸如此类的错误检查在实际的产品代码中至关重要，因此，面试中也不能掉以轻心。 

当然，这些错误检査有时很繁琐，可能会浪费宝贵的面试时间。关键在于指出你会加上错误 
检査。如果错误检査远非一条 ifiS 句就能搞定，写代码时最好先为错误检査预留一些空间，并告 
诉面试官，完成其余代码之后你会补上错误检査代码。 
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录用通知及其他 


□ 如何处理录用和被拒的情况 
□ 如何评估录用待遇 
□ 录用谈判 
□ 人职须知 

7.1 如何处理录用与被拒的情况 


面试结束后，刚觉得可以松口气了，你能又会陷人“面试后综合 征”： 要接受这家公司的 
录用吗？它是理想之选吗？如何拒绝录用通知？怎么处 置回复 期限？我们先来探讨这些问题，接 
下来几节会细说如何评估录用待遇，以及该怎样讨价还价。 

1. 回复期限与延长期限 

录用通知大都附有回复期限，一般为一到四周。不过，要是还在苦等其他公司的回音，你可 
以请求发出录用通知的公司延长冋复期限。条件允许的话，大部分公司都会通情达理，予以配合。 

2. 如何拒绝录用通知 

拒绝公司的录用通知很讲究技巧。即使你现在对该公司不感兴趣，没准儿年后又感兴趣 f 。 
又或者，该公司与你打过交道的联系人跳到另一家更令人心动的公司。因此，你最好还是礼貌得 
体地拒绝录用通知，并与该公司做好沟通。 

拒绝录用通知时，请给出一个合乎情理且不容置疑的理由。比如，若要舍大公司而取创业公 
司，你可以阐明自认为创业公司是当下最佳选择的理由。这两种公司截然不同，大公司也不可能 
突然变成创业公司，所以大公司对此也无可厚非。 

3. 处理被拒的情况 

科技巨头公司一般会拒掉大约80%的求职者，但他们也明白，这些面试未必能充分考察求职 
者的能力。有鉴于此，他们通常会给之前被拒的求职者再次面试的机会。甚至有些公司会主动联 
系以前的求职者，或是因为求职者的面试表现而加快处理流程。 

当你接到拒电时，把它视作一时的挫折而非终身裁决。礼貌地感谢招聘人员为此付出的时间 
和精力，表达自己的遗憾之情.对他们的决定表示理解，并询问什么时候可以再次申请。 

找出被拒的原因很难，招聘人员一般也不会吐露实情。当然，如果你拐弯抹角地询问下次面 
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试该注意哪些事项，运气好的话，说不定可以打探到其中的缘由。你也可以回想一下自己在面试 
中的表现，但根据我的经验，求职者一般无法作出准确分析。你可能认为是因为自己解决某个问 
题时大费周折，不过这都是相 对的； 你并不清楚自己的解题节奏比其他求职者是快还是慢？实际 
上，一般来说，求职者被拒主要是因为编程与算法功底不过关，总之你要在这些方面狠下工夫。 

7.2 如何评估录用待遇 

恭喜你！拿到录用通知了！幸运的话，你可能手握不止一个录用通知。现在，招聘人员的工 
作就是尽其所能说服你签约。那么，又该怎么判断这家公司是否适合自己呢？下面我们将逐一探 
讨评估录用待遇的若干注意事项。 

1. 薪酬待遇的考置 

在评估录用通知时，求职者可能会犯的最大错误也许就是过于看重薪水。如此一叶障 B 导致 
有些求职者最后反而接受了一个更差的录用通知。薪水只是薪酬待遇的一部分。你还应考虑以下 
几点。 

□ 签约奖金、搬家费及其他一次性 津貼： 很多公司都会提供签约奖金，有的还会给搬家费。 

在比较待遇时，最好将这些一次性津貼除以3 ( 或者你预期服务的年限)。 

□各地生活成本 差异： 收到多个来自不同地 K 的录用通知，不要小宥地域差别带来的影响。 
比如，硅谷的生活成本就比西雅图要高出约20%至30%.其中部分原因是加州要收10%的 
州税.华盛顿州则不用。你町以找儿个相关网站来估算各地的生活成本。 

□ 年 终奖： 科技公司的年终奖大约在3%到30%之间。招聘人员可能会告知年终奖的平均数， 
没冇的话，不妨找公司里的朋友打听。 

□股票期权与补 助金： 这部分收人也可能是全年收人的另一大块。就像签约奖金一样，你 
也可以将这部分收人除以3,然后把该数目计人年薪。 

当然，切记一点，能学到的知识及公司对你职业生涯的影响远比薪水来得重要。务请慎重考 
虑当下薪资对你到底有多重要。 

2. 职业发展 

尽管收到录用通知是如此令人兴奋，甚至杏时候幸福感还能持续上几年，但同时你应该开始 
考虑未来的职业发展方向。因此，现在就思考这份工作会对你的职业发展有怎样的影响，非常重 
要。也就是，要关注下列 问题： 

□ 该公司名号能否增加自身履历的份量？ 

□ 我能学到多少知识？我会学到相关领域的技术吗？ 

□ 该职位有无升迁可能？开发人员的职业路径是什么样的？ 

口想转到管理岗位的话，该公司是否提供了切实可行的通道？ 

□ 该公司或团队是否处于上升期？ 

□想要跳槽的话.该公司所在地是否有很多其他机会？我需要搬家吗？ 

最后一点非常重要，也很容易被人忽视。如果你在微软硅谷分部工作，跳槽时会有许多机 
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会。然而，要是在微软西雅图总部，选择余地只剩下亚马逊、谷歌和其他一些小公司。此外， 
要是去了弗吉尼亚州杜勒斯的 AOL , 那选择余地就更小。所以，千万不要忽视地理位置这个因 
素，否则你可能被迫在某家公司“终老”，只因为那里没别的公司可去，除非完全改变自己的 
生活方式。 

3. 公司稳定与否 

每个人的境遇都有所不同，不过，我一般都会鼓励求职者不要太在意公司稳定与否。真要碰 
上了裁员，那你#定也能在同类公司找到一方新天地。你要确认的问 题是： 要是被解雇了，你会 
怎么办？你对找到新工作是否信心满满？ 

4. 幸福指数 

当然，幸福指数也是一个重要考量。以下因素都会影响你工作的幸福感。 

□产 品： 很多人都非常看重自己做的产品，当然这也是一个重要方面。然而，对大多数工 
程师来说.还有比这更敢要的因索，比如.与哪些人一起共亊。 

□经理与 队友： 当人们提及自 己热爱 或痛恨己的工作时，通常是他们的队友与经理占了 
主因。你有没有跟未来的经理、队友碰过面？你亩欢和他们交流吗？ 

□ 企业 文化： 企业文化涉及方方面面，从如何作决策到整体氛围及公司的组织架构。不妨 
问问未来的同亊，看看他们会如何描述公司的企业文化。 

□工作 时长： 问一问未来的队友，他们一般工作多长时间，确定是否契合自己的生活节奏。 

不过，值得注意的是，临近产品发布时，加班在所难免。 

此外，你还要看看是否有机会在不同的团队轮岗（比如在谷歌就很宽 松）， 万一不軎欢，你 
还有机会找到更合适的闭队和部门。 

7.3 录用谈判 

201碑年末，我报了一个谈判训练班。第一天，培训师让我们设想一个昀车的场景。经销商 
A 报的是一 n 价，2万美元。肘经销商 B 允许议价。那么，要讲下多少钱你才愿意去经销商 B 那里 
买车呢？（快！迅速报出你的答 案！） 

最后，全班给出的平均数目是便宜750美元。换 H 之，学员们都愿意付750美元，免除一小时 
的讨价还价。这也没什么奇怪的，在对全班学员进行的民调中，大部分人都表示自己接受工作录 
用时也不会讨价还价。公司给多少就是多少。 

拜托，请理直气壮地还还价吧。下面是几点可资参考的建议。 

(1) 要理直气壮。是的，迈出第一步很难，没什么人喜欢谈判。但讨价还价还是有必要的。 
招聘人员不会因为你有异议就撤冋录用通知，所以你也不会有什么损失。 

(2) 最 好手头有其他选择。从根本上来说，招聘人员愿意与你谈判是因为他们希望你能加人 
公司。如果你手头有其他选择，他们就会更担心你有可能拒绝他们的录用邀约。 

(3) 提出具体的“要价' 给一个具体的数目，比如要求年薪增加7千美金会比泛泛地要求涨薪 
效果更佳。毕竟，如果只是要求涨薪，招聘人员可以不痛不痒地加个1千块来打发你。 
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⑷开出比预期稍高的价码。在谈判中，人们一般不会全盘接受你的要求，总是要讨价还价 
一番。因此，你开的价码可以比自己预期的高一些，这样公司再往下降一降，最后皆大欢喜。 

(5) 不要只盯着薪水。公司更愿意就薪水之外的条件作出让步，因为给你大幅涨薪可能会造 
成团队内部同工不同酬的情况。你可以稍作变通，要求更多的期权或签约奖金。同样，还可以要 
求公司将搬家费直接折算成现金。这对应届毕业生来说更划算，因为他们家什少，搬家也花不了 
多少钱。 

(6) 使用最合适的方法。很多人会建议你通过电话进行谈判。在一定程度上，他们是对的。 
当然，要是不喜欢在电话中讨价还价，可以使用电子邮件。最重要的是你本人有谈判的想法，效 
果比形式更重要。 

此^卜，与大公司进行谈判，你要了解这些公司都有某种职等级别制度，一定的级别对应一定的 
薪资范围。微软对此就有明确的规定。你可以在对应范围内讨价还价，但要价太高就会超出这个范 
围。如果你觉得自己可以拿到更离级别，那就得向招聘人员和未来的团队证明你有这个实力一 
谈判过程会比较难，但也不是没有可能。 

7.4 入职须知 

人职不是终点，而是你职业生涯的新起点。一旦正式加人一家公司，你就得开始做好职业规 
划。你想达到什么样的 H 标，如何才能实现？ 

1. 制定时间表 

“人此门后，非疯即癲”.这种情况很常见。新生活开始之际总是很美好的。可五年之后，你 
还停留在原地不动。到那时才意识到0己虚度了最近-:年的时光，技术没什么长进，屜历也乏# 
BJ 陈。当初为什么不待上两年就走呢？ 

志得意满之际反而是最危险的时候，让你“温水煮青蛙”而忘记了百尺竿头更进一步。这也 
正是工作伊始就要做好职业规划的原因。好好想一想，十年后想干什么？该如何一步步达成 B 
标？此外，每年都要总结一下过去一年自己在职业与技能上取得了 9 P 些进步，明年又有什么样的 
规划？ 

提前做好规划并定期对照检査，这样，就能避免 A 己陷人"温水煮青蛙”的困境。 

2. 打造坚实的人际网络 

在找新工作时，人际网络的作用很大。毕竟，在线申请工作有很多不确定 因素； 有人推荐的 
话就会好很多，而这取决于你的关系网有多强大。 

所以，在工作中要与经理、同事建立良好的关系。就算有人离职，你们也可以继续保持联系。 
比如，在他们离职几周后，写封简短的邮件问候一下，这不仅可以拉近你们的距离，还可以将原 
本的同事关系升华为朋友关系。 

这些小技巧同样适用于你的个人生活。你的朋友、朋友的朋友都是你的宝贵资源。我为人人， 
人人为我。 
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3. 向经理寻求帮助 

有些经理很愿意提携下属，帮助开拓职业道路，但也有些人会不闻不问。所以，这都要看你 
自己是否有心开拓进取，寻求更好的职业发展。 

请开诚布公地向你的主管表明心迹。如欲从事更多后端编程项目，不妨直言相告。如要往管 
理层发展，你可以与经理探讨自己需要做些什么。 

记得时时为自己打气，这样才能逐步实现既定目标。 


_ _m 8 $ _ 

而试考 题 : 


请登录我们的网站 www . CrackingTheCodinglnlerview . com ,下载完整可编译的 Java / Eclipse 工 
程，并与其他读者一起讨论书中的曲试题，提交问题，査看本书勘误，发布简历及寻求其他建议。 
数据结构 
□ 数组与字符串 
口链表 
□ 栈与队列 
□ 树与围 
概念与算法 
□位操作 
□智力题 
□ 数学与概率 
□ 面向对象设计 
□ 递归和动态规划 
□ 扩展性与存储限制 
□ 排序与査找 
□测试 

知识类问题 

□ C 和 C ++ 

□ Java 
□数据库 
□线程与锁 
附加面试题 
□ 中等难題 
□ 高难度题 
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8.1 数组与字符串 

想必本书读者都很熟悉什么是数组和字符串，因此这里不冉赘述细节。我们会把重心放在这 
些数据结构相关的一些常见技巧和问题上。 

请注意，数组问题与字符串问题往往是相通的。换句话说，书中提到的数组问题也可能以字 
符串的形式出现.反之亦然。 

1. 散列表 

散列表是一种将键 （key ) 映射为值 （ value ) 从而实现快速査找的数据结构。在简易实现中， 
散列表包含一个底层数组和-•个散列函数 （ hashfiinction )。 插人一个对象及对应的键时，散列函 
数会将键映射为数组的一个索引。然后，这个对象就会储存到数组中该索引对成的位置。 

不过，通常情况下，这个方法还不够完善。在上面的实现中，所有可能的键必须转化为各不 
相同的散列值，否则一不小心就可能改写某些数据。因此，为了防止这类“碰撺冲突”，这个数 
组会变得非常大，以便放下所有可能的键。 

除了创建按索引 hash ( key ) 储存对象的超大数绀.我们还可以选用小得多的数组，并将对象 
储存在索引为 hash ( key ) % arr ay _ length 的数绀元素指向的链表中。要通过某个键来査找对象， 
就必须根据散列值找到对应的链表，然后在链表中査找相应的键。 

另外，我们还可以采用二叉査找树来实现敗列表。只要我们 U : 这棵树保持平衡，就能保证数 
据査找用时为 OOog «)。此外，这种实现占用的空间可能更少， 原因很 简单，我们不必一开始就 
分配一个大数组。 

面试之前，建议你多加练习，掌捤敗列表的实现和用法。散列表是面试中 M 常见的数据结构 
之…，相关问题也是技术面试的常客。 

下面是一段使用散列表的简单 Java ® 序。 

1 public HashMap<Integer ^ Student > buildHap(Student[] students) { 

2 HashMap<Integer, Student> map ■ new HashMap<Integer, Student>(); 

3 for (Student s : students) nap.put(s.getld (〉， s); 

4 return map; 

5 } 

注意,尽管有时面试官会明确要求使用散列表,但多半还是要靠你自己想到用散列表解决问题。 

2. ArrayList (动态数组） 

ArrayList , 即动态数组，是一种按需动态调整大小的数组，数据访问时间为0(1)。一种典型 
的实现是在数组存满时将其扩容两倍。每次扩容用时0(«),不过这种操作频次极少，因此均摊下 
来访问时间仍为0(1)。 

1 public ArrayList<String> merge(String[] words, String[] more) { 

2 ArrayList<String> sentence = new ArrayList<String>(); 

3 for (String w : words) sentence.add(w); 

4 for (String w : more) sentence.add(w); 
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3. StringBuffer 

假设你要将一组字符串拼接起来，如下所示。这段代码会运行多长时间？为简单起见，假设 
所有字符串等长（皆为 X), —共有《个字 符串。 

1 public String joinWords(String[] words) { 

2 String sentence = n "; 

3 for (String w : words) { 

4 sentence = sentence + w; 



每次拼接都会新建一个字符串，包含原有两个宇符串的全部字符。第一次循环要拷贝#字 
符，第二次循环要拷贝 2 r 个宇符，第三次要拷 3 x 个，依此类推。综上，这段代码的时间开销为 OCt 
+ 2 x +-+ nx ). 可简化为 0( xn 2 )。 为什么不是 0( xn ")? 因为1 + 2 +…+ n 等于 w ( n + l )/2, 即0( 〆 )。 

StringBuffer 可以避免上面的问题。它会直接创建一个足以容纳所有字符串的数组，等到 
拼接完成才将这些宇符串转成一个宇符串。 

1 public String joinMords(String[] words) { 

2 StringBuffer sentence = new StringBuffer(); 

3 for (String w : words) { 

4 sentence.append(w); 

5 } 

6 return sentence.toString(); 

7 > 

不妨试着 ft 己实现•把 StringBuffer , 这对你掌握宇符串、数组和常见数据结构大有裨益。 


面试题目 


1.1 实现一个算法，确定一个字符串的所有宇符是否全都不同。假使不允许使用额外的数据结构， 
又该如何处理？（第108页） 

1.2 用 C 或 C ++ 实现 void reverse ( char * str ) 函数，即反转 一^ hiull 结尾的字符串。（第109页） 
1.3 给定两个字符串，请编写程序，确定其中一个字符串的字符重新排列后，能否变成另一个宇 
符串。（第109页） 

1.4 编写一个方法.将字符串中的空格全部替换为“％20”。假定该字符串尾部有足够的空间存 
放新增字符.并且知道字符串的“真实”长度。 （注： 用 Java 实现的话，请使用字符数组实 
现，以便直接在数组上操作。 ）（ 第111页） 

示例 

输入 ： “Mr John Smith M 
输出： re MrX 2 e ] ohnX 20 Sniith ** 

1.5 利用字符重复出现的次数，编写一个方法，实现基本的宇符串压缩功能。比如，字符 
串 “ aabcccccaaa ” 会变为 “ a 2 blc 5 a 3"。 若“压缩”后的字符串没有变短，则返回原先的字 
符串。（第112页） 
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1.6 给定一幅由阵表示的图像，其中每个像素的大小为4字节，编写一个方法，将图像旋 
转90度。不占用额外内存空间能否做到？（第114页） 

1.7 编写一个算法，若 A / xA / 矩阵中某个元素为0,则将其所在的行与列清零。（第115页） 

1.8 假定有一个方法 isSubstring , 可检査一个单词是否为其他字符串的子串。给定两个宇符串 
si 和 S 2, 请编写代码检査 S 2 是否为 si 旋转而成，要求只能调用一次 isSubstring 。 （比如， 
waterbottle 是 erbottlewat 旋转后的字符串。）（第116页） 


参考问题：位操作 （#5.7); 面向对象设计 （#8.10) ;递归 （#9.3); 排序与查找 （#11.6) ; 
C ++ (#13.10) ;中等难题(#17.7、#17.8、 #17.14) 。 


8.2 链表 


链表问题有时会难倒不少求职者.因为链表元素访问用时不定，而且往往涉及递归。不过， 
好在链表问题不是变化多端，许多问题只是在常见问题的基础上稍作调整而已。 

链表问题非常依赖基本概念，对于求职者来说，可以从无到有实现链表是一项基本要求。下 
面是我们给出的参考实现代码。 

1.创建链表 

下面的代码实现了一个非常基本的单向链表。 



int data; 


public Node(lnt d) { 
data > d; 


void appendToTail(lnt d) { 
Node end = new Node(d); 



while (n.next !■ null) { 
n * n.next; 

> 

n.next * end; 


切记，在面试中遇到链表题时，务必弄清楚它到底是单向链表还是双向链表。 

2.删除单向链表中的结点 

删除单向链表中的结点非常简单。给定一个结点 n , 我们先找到它的前趋结点 prev , 并将 
prev . next 设置为 n • next 。 如果这是双向链表，我们还要更新 n . next ,将 n . next . prev 置为 n . prev 。 
当然，我们必须注意： （1) 检査空 指针； （2>必要时更新表头 （ head ) 或表尾 （ tail ) 指针。 

此外，如果采用 C 、 C ++ 或其他要求开发人员自行管理内存的语言，还应考虑要不要释放删 
除结点的内存。 
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Node deleteNode(Node head, int d) 
Node n = head; 


ita d) { 

I head.next; 


表头指句下一结点 */ 


« null) { 
d) { 
t.next; 

I head; /* 表头不变 */ 


3. “快行指针”技巧 

在处理链表问题时，“快行指针” （ nrnner , 或称第二个指针）是一种很常见的技巧。“快行指 
针"指的是同时用两个指针来迭代访问链表，只不过其中一个比另一个超前一些。“快”指针往 
往先行几步，或与“慢”指针相差固定的步数， 

举个例子.假定有一个链表…- > a n ->4- > b 2 -> …- > b », 你想将其重新排列成 
apb , -- > b 2 ->" -> a n -> b n 。另外，你不知道该链表的长度（但确定它冇偶数个元素)。 

你可以用两个指针，其中 pi (快指针）每次都向前移动两步，而同时 p 2 只移动一步。当 pi 
到达链表末尾时， P 2 刚好位于链表中间位置„然后.再让 pi 与 p 2 —步步从尾向头反向移动，并将 
P2 指向的结点插人到 pi 所指结点后面。 

4. 递归问题 

许多链表问题都要用到递归。解决链表问题碰壁时，不妨试试递归法能否奏效。这里暂时不 
会深人探讨递归，后面会有专门章节予以讲解 3 

当然，还需注意递归算法至少要占用空间.其中《为递归调用的层数。实际上，所有递 
归算法都 可以转 换成迭代法，只是后者实现起来可能要复杂得多。 


面试题目 


2.1 编写代码，移除未排序链表中的重复结点。（第117页） 

进阶 

如果不得使用临时缓冲区，该怎么解决？ 

2.2 实现一个算法，找出单向链表中倒数第奸结点。（第118页） 

2.3 实现一个算法，删除单向链表中间的某个结点，假定你只能访问该结点。（第120页） 
示例 

输人：单向链表 a -> b -> c -> d -> e * 的结点 c 。 

结果： 不返回任何数据，但该链表 变为： a -> b -> d->e 
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2.4 编写代码，以给定值 x 为基准将链表分割成两部分，所有小于; r 的结点排在大于或等于; t 的结 
点之前。（第121页） 

2.5 给定两个用链表表示的整数，每个结点包含一个数位。这些数位是反向存放的，也就是个位 
排在链表首部。编写函数对这两个整数求和，并用链表形式返回结果。（第123页） 

示例 

输人： （7-> 1 -> 6) + (5 -> 9 -> 2), 即617 + 295。 

输出： 2 -> 1 -> 9. 即912。 

进阶 

假设这些数位是正向存放的，请再做一遍。 

示例 

输人： （6 -> 1 -> 7) + (2 -> 9 -> 5). 即617 + 295。 

输出: 9 -> 1 -> 2,即912。 

2.6 给定一个有环链表，实现一个箅法返回环路的开头结点。（第126页） 

有环链表的定义 

在链表中某个结点的 next 元索指向在它前面出现过的结点.則表明该链表存在环路。 

示例 

输人 ： A -> B -> C -> D -> E -> C ( C 结点出现了两 次)。 

输出 ： C 

2.7 编写一个函数，检杳链表是否为回文。（第128页） 

参考 问题： 树与田 （#4.4) ;面向对象设计 （#8.10) ;扩展性与内存限制 （#10.7) ;中等 
难题 （#17.13) 。 

8.3 栈与队列 

和链表问题一样，熟练隼握数据结构的基本原理.栈与队列问题处理起来要容易得多。当然， 
冇些问题也可能相当棘手。部分问題不过是对基本数据结构略作调整，而其他问题则要难得多。 
1.实现一个栈 

栈采用后进先出 （ LIFO ) 顺序。换言之，像一堆盘子那样，最后人栈的元素最先出栈。 

下面给出了找的简单实现代码。注意，找也 SJ 以用链表实现。实际上，栈和链表本质上是一 
样的，只不过用户通常只能看到栈顶元素。 

1 class Stack { 

2 Node top; 

3 

4 Object pop() { 

5 if (top U null) { 

6 Object item = top.data; 

7 top - top.next; 
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8 return itea; 

9 } 

10 return null; 

11 } 

12 

13 void push(Object item) { 

14 Node t ■ new Node(itefli); 

15 t.next * top; 

16 top = t; 

17 > 

18 

19 Object peek() { 

20 return top.data; 

21 > 

22 > 

2. 实现一个队列 

队列采用先进先出 （ FIFO ) 顺序。就像一支排队购票的队伍那样，最早人列的元素也是最先 
出列的。 

队列也可以用链表实现，新增元索追加至表尾。 

1 class Queue { 

2 Node first, last; 

B 

4 void enqueue(Object item) { 

5 if (first ― null) { 

6 last ■ new Node(itea); 

7 first - last; 

8 > else { 

9 last.next = new Node(itea); 

10 last ■ last.next; 

11 } 

12 > 

13 

14 Object dequeue() { 

15 if (first !- null) { 

16 Object item = first.data; 

17 first ■ first.next; 

18 return iten; 

19 > 

20 return null; 

21 > 

22 > 


面试题目 _ 

3.1 描述如何只用一个数组来实现三个栈。（第 131 页） 

3.2 请设计一个栈，除 pop 与 push 方法，还支持 min 方法，可返回栈元素中的最小值。 push、pop 
和 min 三个方法的时间复杂度必须为0(1)。（第135页） 
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3.3 设想有一堆盘子，堆太高可能会倒下来。因此，在现实生活中，盘子堆到一定高度时，我们 
就会另外堆一堆盘子。请实现数据结构 SetOfStacks , 模拟这种行为。 SetOfStacks 应该由 
多个栈组成，并且在前一个找填满时新建一个找。此外， SetOfStacks . pushO 和 
SetOfStacks . pop () 应该与普通栈的操作方法相同（也就是说， pop (> 返回的值，应该跟只 
有一个栈时的情况一样)。（第137页> 

进阶 

实现一个 popAt(int index ) 方法，根据指定的子栈，执行 pop ^ 作。 

3.4 在经典问题汉诺塔中，有3根柱子及 AT 个不同大小的穿孔圆盘，盘子可以滑入任意一根柱子。 
—开始，所有盘子自底向上从大到小依次套在第一根柱子上（即每一个盘子只能放在更大的 
盘子上面)。移动圆盘时有以下 限制： 

(1) 每次只能移动一个 盘子； 

(2) 盘子只能从柱子顶端滑出移到下一根 柱子； 

(3) 盘子只能 ft 在比它大的盘子上。 

请运用栈，编写程序将所有盘子从第一根柱子移到最后一根柱子。（第140页） 

3.5 实现一个 MyQueue 类，该类用两个栈来实现一个队列„ (第142页） 

3.6 编写程序，按升序对找进行排序（即最大元素位于找顶 L 最多只能使用一个额外的找存放 
临时数据，但不得将元素复制到別的数据结构中 （ 如数 组）。 该找支持如下 操作： push 、 pop 、 
peek 和 isEmpty 。 （第 143 页） 

3.7 有家动物收容所只收容狗与猫，且严格遵守“先进先出”的原则。在收养该收容所的动物时， 
收养人只能收养所有动物中“最老”（根据进人收容所的时间长短）的动物，或者，可以挑 
选猫或狗（同时必须收养此类动物中“最老”的)。换言之，收养人不能 A 由挑选想收养的 
对象。请创建适用于这个系统的数据结构，实现各种換作方法，比如 enqueue 、 dequeueAny , 
dequeueDog 和 dequeueCat 等。允许使用 Java 内置的 LinkedList 数据结构。（第145页） 

参考 问題： 链表 （#2.7) ;数学与概率 （#7.7) 。 

8.4 树与图 

许多求职者会觉得树与图的问題是最难对付的。检索这两种数据结构比数组或链表等线性数 
据结构要复杂得多。此外，在最坏情况和平均情况下，检索用时可能差别巨大，对于任意算法， 
我们都要从这两方面进行评估。能够自如地从无到有实现树或图对求职者而言非常重要。 

1. 需要注意的潜在问题 

树与图的问题容易出现含糊的细节和错误的假设。务必留意下列问题，必要时寻求澄清。 

• 二又树与二叉查找树 

碰到二叉树问题时，许多求职者会假定面试官问的是二叉查找树。此时务必问清楚二叉树是 
否为二叉査找树。二叉査找树附加有如下 条件： 对于任意结点，左子结点小于或等于当前结点， 
后者又小于所有右子结点。 


52 第 8 章面试考题 


• 平衡与不平衡 

许多树都是平衡的，但并非全都如此。树是否平衡要找面试官确认。如果树是不平衡的，你 
应当从平均情况和最坏情况所需时间来描述自己的算法。注意，树的平衡有多种方法，平衡一棵 
树只意味着子树的深度差不会超过一定值.并不表示左子树和右子树的深度完全相同。 

• 完满和完整 （Full and Complete ) 

完满和完整树的所有叶结点都在树的底部，所有非叶结点都有两个子结点。注意完满和完整 
树极其 稀少，因为一棵树必须正好有2•- I 个结点才能满足这个条件。 

2. 二叉树遍历 

面试之前，你应该能够熟练实现中序、后序和前序遍历。其中最常见的是中序遍历，先遍历 
左子树，然后访问当前结点，最后遍历右子树。 

3 . 树的 平衡： 红黑树和平衡二叉树 

学4如何实现平衡树可助你成为更好的 软件工 程师，只不过面试中很少会问及平衡树。你应 
该熟悉平衡树各种操作的执行时间，大致丫解如何平衡一棵树。当然，就面试而言，攀握个中细 
节也许没什么必要。 

4. 单词査找树 （ trie ) 

trie 树是层树的一种变体，其中每个结点存储有字符。锒棵树的每条路径自上而下表示一个 
单词。一棵简单的 trie 树类似下阁： 



5. 图的遍历 

大部分求职者都比较熟悉二叉树的遍历，但图的遍历则要难得多。广度优先搜索 （ BFS ) 更 
是难上加难。 

值得注意的是，广度优先搜索 （BFS ) 和深度优先搜索 （DFS ) 通常用于不同的场景。如要访 
问图中所有结点®,或者访问最少的结点直至找到想找的结点， DFS — 般最为简单。不过，如果一 
棵树的规模非常大，在离最初结点太远时想要随时退出的话， DFS 可能会有 问题； 我们可能搜索 
了该结点的成千上万个祖先结点，却还未捜索该结点的全部子结点。对于这些情况,一般首选 BFS 。 


①图中的“结点” -- 般称为 顷点. 这里依原文译作结点。——译者注 
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• 深度优先搜索 （ DFS ) 

在 DFS 中，我们会访问结点 r , 然后循环访问 r 的每个相邻结点。在访问 r 的相邻结点 n 时，我 
们会在继续访问 r 的其他相邻结点之前先访问 n 的所有相邻结点。也就是说，在继续搜索 f 的其他 
子结点之前，我们会先穷尽搜索 n 的子结点。 

注意，前序和树遍历的其他形式都是一种 DFS 。 主要区别在于，对图实现该算法时，我们必 
须先检査该结点是否已访问。如果不这么做，就 可能陷 入无限循环。 

下面是实现 DFS 的伪代码。 
void search(Node root) { 
if (root null) return; 
visit(root); 
root.visited » true; 
foreach (Node n in root.adjacent) { 
if (n.visited «* false) { 
search(n); 


• 广度优先搜索 （ BFS ) 

BFS 相对不太直观，除非之前熟悉 BFS 的实现，否则大部分求职者都会觉得它很难对付。 

在 BFS 中，我们会在搜索 r 的“孙子结点”之前先访问结点 r 的所有相邻结点。用队列实现的 
迭代方案往往最有效。 


1 



1 void search(Node root) { 

2 Queue queue » new Queue(); 

B root.visited ■ true; 

4 visit(root); 

5 queue, enqueue (root); // 加至队列見部 


while (!queue.isEmptyO) { 

Node r ■ queue.dequeue(); // 从队列头部移味 
foreach (Node n in r.adjacent) { 
if (n.visited ** false) { 
visit(n); 
n•visited = true; 
queue.enqueue(n); 


当面试官要求你实现 BFS 时，切记艾键在于队列的使用。用了队列.这个算法的其余部分自 
然也就成型了。 


面试题目 


4.1 实现一个函数，检査二叉树是否平衡。在这个问题中，平衡树的定义 如下： 任意一个结点, 
其两棵子树的高度差不超过1。（第146页） 
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4.2 给定有向图，设计一个算法，找出两个结点之间是否存在一条路径。（第148页） 

4.3 给定一个有序整数数组，元素各不相同且按升序排列，编写一个算法，创建一棵髙度最小的 
二叉査找树。（第149页） 

4.4 给定一棵二叉树，设计一个箅法，创建含有某一深度上所有结点的链表（比如，若一棵树的 
深度为 D , 则会创建出 IVh 链表)。（第150页） 

4.5 实现一个函数，检査一棵二叉树是否为二叉査找树。（第151页） 

4.6 设计一个算法，找出二叉査找树中指定结点的“下一个”结点（也即中序后继）。可以假定 
每个结点都含有指向父结点的连接。（第154页） 

4.7 设计并实现一个算法，找出二叉树中某两个结点的第一个共同祖先。不得将额外的结点储存 
在另外的数据结构中。 注意： 这不一定是二叉査 找树。（第 155页） 

4.8 你有两棵非常大的二 叉树： T 1. 有几百万个 结点； T 2. 有几百个结点。设计一个算法，判 
断 T 2 是否为 T 1 的子树。 

如果 T 1 有这么一个结点 n , 其子树与 T 2 —模一样，则 T 2 为 T 1 的子树。也就是说，从结点 n 处 
把树砍断，得到的树与 T 2 完全相同。（第159页） 

4.9 给定一棵_：叉树，其中每个结点都含有一^数值。设计一^算法，打印结点数值总和等于某个 
给定值的所有路径。注意，路径不一定非得从二叉树的根结点或叶结点开始或结束。 （ 第161页） 

参考 问题： 扩展性与存储限制（#10.2、 #10.5 ) :排序与査找 （#11.8) »中等难题（#17.13、 
#17.14) ;高难度题(#18.6、#18.8、#18.9、#18.10、 #18.13) Q 

8.5 位操作 

位操作可以用于解决各种各样的问题 3 有时候.有的问题会明确要求用位操作来解决，而在 
其他情况下，位操作也是优化代码的实用技巧。写代码要熟悉位操作，同时也要熟练掌握位操作 
的手工运箅。处理位操作问题时，务必小心翼翼，不经意间就会犯下各种小错。代码写好后一定 
要进行充分的测试，也可以边写代码边测试。 

1.手工位操作 

如果像很多人一样，你也惧怕位操作问题.以下这些练习对你大有裨益。当你一筹莫展或困 
惑不解时，不妨换用十进制来理解相关操作，冉将这些操作过程应用到二进制上。 

记住，符号 A 表示 XOR (异或）操作，4示非（取反）操作。为简单起见，假定操作数的位 
宽为4位。我们可以手工或是施以若干技巧（详情如下）解决下表第三列的问题。 


0110 + 0010 

0011 * 0101 

ene + ene 

0011 + 0010 

0011 • 9011 

0100 • 00ii 

0110 - 0011 

nei » 2 

1101 A (-1101) 

1006 - ene 

ii0i a 0i0i 

leu a (~e « 2 ) 


答案：第一行 （1000, 1111, 1100) :第二行 <0101, 1001, 1100) : S 三行 （0011, 0011, 1111) ;第四行 
( 0010, 1000, 10 明）。 
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第三列问题的解决技巧如下。 

(1) 0110 + 0110相当于0110 * 2 ，也就是将0110左移1位。 

(2) 0100等于4, 0100 * 0011也就是将0011乘以4。一个数与 2" 相乘，相当于将这个数左移《 
位。于是，将0011左移2位得到 1100 c 

(3) 逐个比特分解这一操作。一个比特与对它取反的值做异或操作，结果总是1。因此， a -(~ a ) 
的结果是一串1。 

(4) 类似 x & (-0 << n ) 的操作会将 x 最右 边的; I 位淸零。 -0 的值就是一串1,将它左移《位后 
的结果为一串1后面跟《个0。将这个数与 x 进行“位与”操作，相当于将 x 最右边的《位清零。 

要处理其他问题，不妨打开 Windows 上的计算器，选择“査看” （ View ) 菜单项，再点选该 
工具的“程序员” ( Programmer ) 版本。有了这个应用程序，就可以执行位与、异或和移位等各 
种二进制运算。 

2. 位操作原理与技巧 

处理位操作问题时，理解以下原理会大有帮助。不要•味死记硬背，而应思考这些等式何以 
成立。在下面的示例中， “ Is ” 和 “ Os ” 分别表示一串1和一串0。 

X A 0S = X X & 0S = 0 X I 0S ° X 

X A Is = ~X X & Is - X X I Is = Is 

X A X = 0 X S X = X X I X = X 

要理解这些表达式的含义，你必须记住所有操作是按位进行的，某一位的运算结果不会影响 
其余位。也就是说，只要上述语句对某一位成立，则同样适用于一串位。 

3. 常见位 操作： 获取、 设置、 清除及更新位数据 

以下这些位操作非常重要，不过切忌死记硬背，否则只会滋生一些难以察觉的错误。相反， 
你要吃透这些操作方法，学会举一反三，灵活处理其他问题 3 

• 获取 

该方法将1左移《位，得到形如00010000的值。接着，对这个值与 num 执行“位与”操作，从 
而将啦 之外的所有位清零。最后，检査该结果是否为零。不为零说明;位为1,否则，/位为0。 

1 boolean getBit(int nun, int i) { 

2 return ((num & (1 << i)) != 0); 

3 > 

• 置位 

setBit 先将 1 左移 ^ •位，得到形如 00010000 的值。接着，对这个值和 num 执行“位或”操作， 
这样只会改变 f 位的数据。该掩码位除外的位均为零，故而不会影响 num 的其余位。 

1 int setBit(int num f int i) { 

2 return num | (1 « i); 

3 > 

* 清零 

该方法与 setBit 刚好相反。首先，将1左移/位取得形如00010000的值，对这个值取反进而得 
到类似11101111的掩码。接着，对该掩码和 numm 行“位与”操作。这样只会清零 mim 的，•位，其 
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余位则保持不变。 

1 int clearBit(int num, int i) { 

2 int mask = -(1 « i); 

3 return num & mask; 


将 num 最髙位至 / 位（含）清零的做法 如下： 

1 int clearBitsMSBthroughl(int nu_, int i) { 

2 int mask = (1 « i) - 1; 

3 return num & mask; 


将/位至 o 位（含）清零的做法 如下： 

1 int clear8itslthrough0(int num, int i) { 

2 int mask = -((1 << (i+1)) - 1); 

3 return num & nask; 


• 更新 

这个方法将 setBit 与 clearBit 合二为 一 。首先，用诸如11181111的掩码将 num 的第/位清零。 
接着，将待写人值 v 左移/位，得到一个《位为 vfi 其余位都为0的数。最后，对之前取得的两个结果 
执行“位或"操作， v 为1则将 num 的涖更新为 1. 否则该位仍为0。 

1 int updateBit(int nun, int i, int v) { 

2 int mask = -(1 « i); 

3 return (num & mask) | (v « 1); 


面试题目 _ 

5.1 给定两个 32 位的粮数 W 与 M , 以及表示比特位置的/与/。编写一个方法，将 A 4 插人使得 A / 
从嫩第 j 位开始, 到第/位结束。假定从/位到 *' 位足以 容纳从 也即若 WH 0011, 那勾和 Z 之间 
至少可容纳5个位。例如，不可能出與/= 3 和/ = 2的情况，因为第3位和第2位之间放不下 A /。 
(第163页) 

示例 

输人 ： N = 10000000000, M = 10011, i = 2, j = 6 
输出 ： N = 10001001100 

5.2 给定一个介于0和1之间的实数（如 0.72), 类型为 double , 打印它的二进制表示。如果该数字 
无法精确地用32位以内的二进制表示，则打印 “ ERROR ”。 （第164页） 

5.3 给定一个正整数，找出与其二进制表示中1的个数相同、且大小最接近的那两个数（一个略 
大，一个略 小)。 （第165页） 

5.4 解释代码 （（n & ( n -1)) == 0) 的具体含义。（第170页） 

5.5 编写一个函数，确定需要改变几个位，才能将整敦4转成整数（第171页） 

• 示例 
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输人： 31, 14 
输出： 2 

5.6 编写程序，交换某个整数的奇数位和偶数位，使用指令越少越好（也就是说，位0与位1交换， 
位2与位3交换，依此类推 >。 （ 第171 页） 

5.7 数组 A 包含0到《的所有整数，但其中缺了一个。在这个问题中.只用一次操作无法取得数组 
A 里某个整数的完整内容。此外，数组 A 的元素皆以二进制表示，唯一可用的访问操作是“从 
A [ i ] 取出第/位数据”，该操作的时间复杂度为常数。请编写代码找出那个缺失的整数。你冇 
办法在 0(/0 时间内完成吗？（第172 页） 

5.8 有个单色屏幕存储在一个一维字节数组中，使得8个连续像素可以存放在一个字节里 。屏裔 
宽度为 w , 且 w 可被8整除 （ 即一个字节不会分布在两行上），屏幕高度可由数组长度及屏莆 
宽度推算得出。 请实现 一个函数 drawHorizontalLine ( byte [] screen , int width , int xl , 
int x 2, int y ), 绘制从点 ( aj ) 到点(右,的水平线。（第174页） 

参考 问題： 數组与字符串 (#1.1, #1.7) ; 递归 （#9.4、 #9.11) ; 扩展性与存储限制 （#10.3、 

#10.4 ) ； C ++ (#13.9) ! 中等难題 （#17.1, #17.4) ; 高难度題 （#18.1) » 

8.6 智力题 


智力题 HWA 4 冇争议的面试题之列，很多公司甚至明文规定面试中不得出现智力题。尽管如 
此，你还是会时不时地碰到它。为什么呢？因为人们对于智力题尚无明确的定义。 

不过，好在哪怕你碰到了这类问题，一般来说它们也不会太难。你不需要做脑筋急转弯，并 
且几乎总有办法通过逻辑 推理将 Mi 答案。很多智力题其至还涉及数学或计算机科学的基础知识。 

下面，我们会列举一些应对智力题的常见方法。 

1. 大声说出你的思路 

遇到智力题时，切忌惊慌。就像算法题一样，面试官只不过想看看你会如何处理 难题； 他们 
并不期待你立即给出正确答案。只管大声说出解题思路.让面试官了解你的应对之道。 

2. 总 结规律和模式 

很多情况下，你会发现，把解题过程中发现的“规律”或“模式"写下来帮助很大。并且， 
你确实应该这么做，这有助于加深记忆。下面会举例说明这种方法。 

给定两条绳子，每条绳子燃烧殆尽正好要用一个小时。怎样用这两条绳子准确分钟？ 
注意这些绳子密度不均匀，因此烧掉半截绳子不一定正好用半个小时。 

技巧： 先别急着往下看，不妨试着自己解决此问題。一定要看下面的提示信息的话——也请 
一段一段慢慢看。后续段落会逐步揭晓答案 a 

从题目可知，计量一小时不成问题。当然也可以计量两小时，先点燃一根绳子，等它燃烧殆 
尽，再点燃第二根。由此我们总结出第一条规律。 

规律1:给定两条绳子，燃烧殆尽各需 x 分钟和3^钟，我们可以计时 
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那么，还有其他烧绳子的花样吗？当然，我们知道从中间（或绳子两头以外的任意位置）点 
燃绳子没什么用。火苗会向绳子两头蔓延，我们不知道过多久才会烧完。 

话说回来，我们可以同时点燃绳子两头。30分钟后火焰便会在绳子某个位置汇合。 

规律2:给定一条需要 c 分钟烧完的绳子，我们可以计时 x /2 分钟。 

由此可知，用一条绳子可以计时3_。这就意味着我们可以在燃烧第二条绳子时减去这30 
分钟，也就是点燃第一条绳子两头的同时，只点燃第二条绳子的一头。 

规律3:烧完绳子1用时 x 分钟，绳子2用时则可以用第二条绳子计时 h ) 分钟或 ( y - x /2> 
分钟。 

综合以上规律，不难 得出： 既然可以用绳子2计时30^钟.再适时点燃绳子2的另一头（见规 
律 2), 则15分钟后绳子2便会燃烧殆尽。 

将上面的做法从头至尾整理如下。 

(1) 点燃绳子1两头的同时.点燃绳子2的一头。 

⑺当绳子1从两头烧至中 M 某个位置时，正好过去30分钟。 Ifii 绳子2还可以冉烧30分钟。 

(3) 此时，点燃绳子2的另一头。 

(4) 15分钟后，绳子2将全部烧完。 

从中可以看出，只要一步步归纳规律，并在此基础 I :进行总结.智力题便可迎刃而解„ 

3. 略作变通 

许多智力题往往涉及将最坏情况减至最低限度的问题.措辞上要么要求尽可能减少步骤，要 
么限定具体的试验次数。 一 种实用的技巧是尝试“平衡”最坏情况。也就是说，如果早先的解决 
方案效果+太理想，我们可以针对最坏悄况略作变通。用一个例子来解释会更为清晰。 

“九球称重”是一个经典面试题。给定9个球，其中8个球的重 a 相间，只有一个比较重。然 
后给定一个天平，可以称出左右两边哪边 更®。 最多用两次天平，找出这个重球。 

第一种做法是将球分成2组，4个一组，第9个球暂时搁在 一边。 如果有一组球较重，则重球 
必在 其中； 但如果两组球 重量相 N , 则第9个球为重球。按此思路将包含重球的这一组球再分成 
两组，在最坏情况下我们需要称 M 3 次一多了 一次！ 

因此，这是一个“失衡”的 解法： 如果第9个球是重球，我们只 需称量一次； 但如果不是， 
则需称量3次。如果我们略作调整，将更多的球与第9个球配在一起，就不会出现“失衡”的状况。 
这就是所谓“最坏情况下的平衡”。 

现在，将这些球均分成3个一组共3组，称量一次就能知道哪一组球更重。我们甚至可以总结 
出一条 规律： 给定/ V 个球，其中能被3整除.称量一次便能找到包含重球的那一组球。 

找到这一组3个球之后，我们只是简笮地重复此前的 模式： 先把一个球放到一边，称童剩下 
的两个球。从中挑出那个 重球； 或者，如果这两个球重量相同，那第3个球便是重球。 

4. 触类旁通 

要是卡壳了，不妨考虑运用前面提到的算法題的五种解法。剔除技术层面的因素，智力题不 
外乎就是些算法题。其中，举例法、简化推广法、模式匹配法，以及简单构造法可能会特别有用。 
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面试题目 


6.1 有20瓶药丸，其中19瓶装有1克/粒的药丸，余下一瓶装有 1.1 克/粒的药丸。给你一台称重精 
准的天平，怎么找出比较重的那瓶药丸？天平只能用一次。（第175页） 

6.2 有个 8 x 8 棋盘，其中对角的角落上，两个方格被切掉了。给定31块多米诺骨牌，一块骨牌恰 
好可以覆盖两个方格。用这31块骨牌能否盖住整个棋盘？请证明你的答案（提供范例，或证 
明为什么不可能)。（第176页） 

6.3 有两个水壶，容量分别为5夸脱（美 制： 1夸脱 =0.946 升. 英制： 1夸脱 =1.136 升）和3夸脱， 
若水的供应不限量（但没有 M 杯），怎么用这两个水壶得到刚好4夸脱的水？注意，这两个水 
壶呈不规则形状，无法精准地装满“半壶”水。（第177 页） 

6.4 有个岛上住着一群人，有一天来了个游客，定了一条奇怪的 规矩： 所有蓝眼睛的人都必须尽 
快离开这个岛。每晚8点会有一个航班离岛。每个人都看得见别人眼骑的颜色.但不知道自 
己的（別人也不可以告知)。此外，他们不知道岛上到底有多少人是蓝眼睹的，只知道至少 
有一个人的眼睛是蓝色的。所有蓝眼睹的人要花几天才能离开这个岛？（第177页） 

6.5 有栋建筑物高100层。若从第层或更高的楼层扔下来，鸡蛋就会破掉。若从第 W 层以下的楼 
层扔下来则不会破掉。给你2个鸡蛋，请找出 A /, 并要求最差情况下扔鸡蛋的次数为最少。（第 
178页〉 

6.6 走廊上有 HXH ' 关上的储物柜。有个人先是将100个柜子全都打开。接着，每数两个柜子关上 
一个。然后.在第〒轮时.冉每隔两个就切换第气个柜子的开关状态（也就是将关上的柜子 
打开，将打开的关上)。照此规律反复搡作100次，在第/轮，这个人会每数/个就切 换第, •个柜 
子的状态。当第100轮经过走庳时，只切换第100个柜子的开关状态，此时有几个柜子是开着 
的？（第179页） 

8.7 数学与概率 

在面试时碰到的许多数学问題，其中很多看起来像是智力題，其实大都可以运用逻辑、有系 
统地解决。这些问题通常都以数学或计算机科学为基础.运用这些知识可以解决问题或检验答案 
对错。本节将介绍那些关系最紧密的数学概念。 

1.素数 

大家应该都知道，每一个数都吋以分解成素数为乘积。 例如： 

84 = 2 2 *3'*5°*7 | *11 0 * 13° *17°* — 

注意其中不少素数的指数为零。 

• 整除 

上面的素数定理指出，要想以： r 整唉 y (写作却，或 modO ；， x ) = 0 ), x 素因子分解的所有素数 
必须出现在 _ y 的素因子分解中。具体 如下： 

令文 = 2/° * y l * y 2 * 7^ * I j/ 4 *... 
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令 y = 2*° * 3 41 * s 42 * * 1 l w * … 

^ x \ y 9 则//<=浴对所有/都成 立。 

实际上，的最大公约 数为： 

gcd(x y ) = 2 nun ^°* 4 ° , * 3« nin (/ | .*i) ♦ 5 n » n (/ 2 . 42 ) * ... 

x 和 y 的最小公倍 数为： 

lcm(jc, y ) = 2 max(>0, W) * 3 mg *o , .*o • •切 * … 

下面先做一个趣味练习，想一想.将 gcd 与 lcm 相乘.结果是什么？ 
gcd * lcm = 2 minV0, ^ * 2 n * x ^ 0,A0) * 3 min ^ l,4,) >* 3 nm ^ l * A,) * ••• 

— 2min(/0.*0) + max(/0.*0) * * ... 

_ 2/0**0 * yl *A1 * ... 

•• =2f° * 2*° • y 1 • 3* 1 * … 


=砂 

• 素性检査 

这个问题很常见，有必要特别说明一下。最原始的做法是从2到/ »-1 进行迭代，每次迭代都检 
査能否整除。 

1 boolean primeNaive(int n) { 

2 if (n < 2 ) { 

3 return false; 

4 > 

5 for (int i ■ 2; i < n; { 

6 if (n % i — 0 ) { 

7 return false; 

8 > 

9 } 

10 return true; 

11 } 

下面有一处很小但重要的 改动： 只需迭代至/!的平方根即可。 

1 boolean primeSlightlyBetter(int n) { 

2 if (n < 2) { 

3 return false; 

4 > 

5 int sqrt s (int) Math.sqrt(n); 

6 for (int i ■ 2 ; i <■ sqrt; i++) { 

7 if (n X i ■* 0) return false; 

8 > 

9 return true; 

10 } 

使用 sqrt 就够了，因为每个可以整除的数 a , 都有个补数6, 3. a*b = n 。 > sqrt , 
则 Z >< sqrUm 为 sqrt ， sqrt = n k 因此，当 fl 大于岣 rt 时，就不需要检査了，因为已经用 A 检 
査过了。 

当然，在现实中，我们真正要做的只是检査可否被素数整除。这时埃拉托斯特尼筛法 （ Sieve 
of Eratosthenes ) 就派上用场了。 
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• 生成素数 序列： 埃拉托斯特尼筛法 

埃拉托斯特尼筛法能够非常高效地生成素数序列，原理是剔除所有可被素数整除的非素数。 
一开始列出到 max 为止的所有数字。首先，划掉所有可被2整除的数 （ 2保留）。然后，找到下 
一个素数（也即 下一个 不会被划掉的 数）. 并划掉所有可被它整除的数。划掉所有可被2、3、5、 
7、11等素数整除的数，最终可得到2到 max 之间的素数序列。 

下面是埃拉托斯特尼筛法的实现代码。 

1 boolean[] sieveOfEratosthenes(int max) { 

2 boolean[] flags ■ new boolean[max + 1]; 

3 int count « 0; 

4 

5 init(flags); // 将 flags 中 0 、 1 元索陳外的所有元索设为 true 

6 int prime - 2 ; 

7 

8 while (prime <* max) { 

9 /• 划掉余下为 prime 倍数的数字 */ 

10 crossOff(flags, prime); 

11 

12 /* 找出下一个为 true 的值 V 

13 prime » getNextPrime(flags J prime); 

14 

15 if (prime >- flags.length) { 

16 break; 

17 } 

18 } 

19 

20 return flags; 

21 } 

22 

2 B void crossOff(boolean[] flags ， int prime) { 

24 划掉余下为 prime 倍軚的 数字，我们可以从 

25 * (prime*pri«»€) 开始.因为知果 k • prine 且 

26 * k < prime , 这个值早就在之前的速代里 

27 * 被划掉 T. V 

28 for (int i - prime * prime; i < flags.length; i +- prime) { 

29 flags[i] = false; 

30 > 

31 } 

32 

33 int getNextPrime(boolean[] flags, int prime) { 

34 int next » prime + 1; 

35 while (next < flags.length && !flags[next]) { 

36 next++; 

37 > 

38 return next; 

39 } 

当然，在上面的代码中，还有一些地方可以优化，比如，可以只将奇数放进数组，所需空间 
即可减半。 

2. 概率 

概率可以很复杂，还好它是建立在若干基本定理之上，而这些定理可以逻辑推导得出。 
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• 独立 

若 A 与 B 相互独立（也即，一个事件的发生，推不出另一个事件的发生），那么， P ( A 与 B 都发 
生）= P ( A ) P ( B ) 0 这条规则直接推导自 P(B 发生，在嫂生的情况下卜 P ( B ), 因为 AKB 没关系。 

• 互斥 

若 A 与 B 互斥（也即，若一个事件发生.则另一个事件就不可能发生），则 P ( A 或 B 发生）= 
P ( A ) + P ( B ) 0 这是因为 P(A 与 B 都发生 ） =0,所以，删除了之前 P(A 或 B 发生)算式中的 P(A 与 B 
都发生 > 一项。 

奇怪的是，许多人都会搞混独立和互斥的概念。其实两者完全不同。实际上，两个事件不可 
能同时是独立的又是互斥的（只要两者概率都大于零)。为什么？因为互斥意味着一个事件发生 
了，另一个事件就不可能发生。而独立是指一个事件的发生跟另一个事件的发生毫无关联。因此， 
只要两个事件发生的概率不为零，它们就不可能既互斥又独立。 

若一个或两个事件的概率为零（也就是不可能发生），那么这两个亊件同时既独立又互斥。 
这很容易直接应用独立和互斥的定义 （ 等式） 证明出来。 

注意事项 

<1>小心， float 和 double 的精度有别。 

不要假设某个值 （ 比如一条线的斜率）为 int 型，除非已明确告知这个值为 int 型。 

(3) 除非另有说明，否则不要假定多个亊件是独立的（或互斥的)。因此，切忌肓目将概率相 
乘或相加。 


面试题目 


7.1 有个篮球框，下面两种玩法可任选一种。 

玩法1: 一次出手机会，投篮命中得分。 

玩法2:三次出手机会，必须投中两次。 

如果 p 是某次投篮命中的概率，则 p 的值为多少时，才会选择玩法1或玩法2?(第179页） 

7.2 三角形的三个顶点上各有一只蚂蚁。如果蚂蚁开始沿着三角形的边爬行，两只或三只蚂蚁撞 
在一起的概率有多大？假定每只蚂蚁会随机选一个方向，每个方向被选到的几率相等，而且 
=.只蚂蚁的爬行速度相同。 

类似 问题： 在顶点的多边形上有只蚂蚁，求出这些蚂蚁发生碰撞的概率。（第180页） 
7.3 给定直角坐标系上的两条线，确定这两条线会不会相交。（第181页） 

7.4 编写方法，实现整数的乘法、减法和除法运算。只允许使用加号。（第182页） 

7.5 在二维平面上，有两个正方形，请找出一条直线，能够将这两个正方形对半分。假定正方形 
的上下两条边与;平行。（第184页） 

7.6 在二维平面上，有一些点，请找出经过点数最多的那条线。（第186页） 

7.7 有些数的素因子只有3、5、7,请设计一个算法，找出其中第; H ' 数。（第188页） 


参考 问题： 中等难题 (#17.11) ;高 难度題 （#18.2) 。 
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8.8 面向对象设计 

面向对象设计问题要求求职者设计出类和方法，以实现技术问题或描述真实生活中的对象。 
这类问题可以让面试官洞悉你的编码风格一至少被认为 如此。 

这些问题并不那么着重于设计模式，而是意在考察你是否懂得如何打造优雅、容易维护的面 
向对象代码。若在这类问题上表现不佳，面试可能会亮起红灯。 

1. 如何解答面向对象设计问肢 

对于面向对象设计问题，要设计的对象可能是真实世界的东西，也可能是某个技术任务，不 
论如何，我们都能以类似的途径解决。以下解題思路适用于很多问题 3 

• 步骤1:处理不明螭的地方 

面向对象设计 （OOD) 问题往往会故意放些烟薄弹，意在检验你是武断臆测，还是提出问题 
以厘淸问题。毕竞，开发人员要是没弄清楚自己要开发什么，就直接挽起袖子开始编码，只会浪 
费公司的财力物力，还可能造成更严重的后果。 

碰到面向对象设计问题时，你应该先问清楚.谁是使用者、他们将如何使用。对某些问题， 
你甚至还要问淸楚 '5W1H", 也就是 Who ( 淮）. What ( 什 么）， Where ( 哪里）、 When ( 何时）、 
Why ( 为什么）、 How ( 如何)。 

举个例了_,假设面试官让你描述咖啡机的面向对象设计。这个问題看似简中.明了，其实不然。 

这台咖啡机可能是一款 T 业型机器，设计用来放在大餐厅里，每小时要服务几百位顾客，还 
要能制作10种+同口味的咖啡。乂或者，它可能是设计给老年人使用的简易咖啡机，只要能制作 
简单的黑咖啡就行。这些用例将大大影响你的设计。 

• 步骤2:定义核心对象 

r 解我们要设计的东两后，接下来就该思考系统的“核心对象”了。比如，假设要为一家餐 
馆进行面向对象设计。那么，核心对象可能包括餐桌 （Table)、 顾客 （Guest)、 宴席 （Party )、 
订单 （ Order )、餐点 （Meal)» 员工 （Employee )、服务员 （Server ) 和领班 （Host )。 

• 步嫌 3: 分析对象关系 

定义出核心对象之后，接下来要分析这些对象之间的关系。其中，哪些对象是其他对象的数 
据成员？哪个对象继承自别的对象？对象之间是多对多的关系，还是一对多的关系？ 

比如，在处理餐馆问题时，我们可能会想到以下设计。 

□ 宴席包括很多顾客。 

□ 服务员和领班都继承自员工。 

□ 每一张餐桌对应一个宴席，但每个宴席可能拥冇多张餐桌。 

口每家餐馆有一个 领班。 

分析对象关系一定要非常小心——我们经常会作出错误假设。比如，哪怕是-张餐桌也可能 
包含多个“宴席”（在热门餐馆里，“拼桌”很常见)。进行设计时，你应该跟面试官探讨一下， 
了解你的设计要做到多通用。 
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• 步骤 4 :研究对象的动作 

到这一步，你的面向对象设计应该初具雏形了。接下来，该想想对象可执行的关键动作，以 
及对象之间的关联。你可能会发现&己遗漏了某些对象，这时就需要补全并更新设计。 

例如，一个“宴席”对象（由一群顾客组成）走进了 “餐馆”，一位“顾客”找“领班”要 
求一张“餐桌”。“领班”开始査验“预订 "（ Reservation ), 若找到记录，便将“宴席”对象领 
到“餐桌”前。否则，“宴席”对象就要排在列表末尾。等到其他“宴席”对象离开后，有“餐 
桌”空出来，就可以分配给列表中的“宴席”对象。 

2. 设计模式 

因为面试官想 要考察 的是你的能力而不是知识，大部分面试都不会考设计模式。不过，掌握 
单例设计模式 （ Singleton ) 和工厂方法 （ FactoryMethod 〉 设计模式对面试来说特别有用，所以， 
接下来我们会作简单介绍。 

设计模式太多了，限于篇幅，没办法在本书中一一探讨。你可以挑本专门讨论这个主题的书 
来研读，这对提高你的软件工程技能会大有裨益。 

• 单例设计模式 

单例设计模式确保一个类只有一个实例，并且只能通过类内部方法访问此实例。当你有个“全 
局”对象，并且只会有一个这种实例时，这个模式特別好用。比如.在实现“餐馆”时，我们可 
能想 ih 它只有一个“餐馆”实例。 

1 public class Restaurant { 

2 private static Restaurant —instance » null; 

3 protected Restaurant() { ... } 

4 public static Restaurant getlnstance() { 


if (—instance ■■ null) { 



• 工厂方法设计模式 

T 厂方法提供接口以创建某个类的实例，由子类决定实例化哪个类。实现时，你可以将创建 
器类 （ Creator ) 设计为抽象类型，不为工厂方法提供具体 实现； 或者，创建器类是实体类，为工 
厂方法提供具体实现。在这种情况下，工厂方法需要传人参数，代表该实例化哪个类。 

1 public class CardGame { 

2 public static CardGame createCardGame(GaneType type) { 

3 if (type == GameType.Poker) { 

4 return new PokerGame(); 

5 > else if (type == GameType.Blackjack) { 

6 return new BlackDackGame(); 
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面试题目 _ 

8.1 请设计用于通用扑克牌的数据结构。并说明你会如何创建该数据结构的子类，实现“二十一 
点”游戏。（第192页） 

8.2 设想你有个呼叫中心，员工分成三个 层级： 接线员、主管和经理。客户来电会先分配给有空 
的接线员。若接线员处理不了，就必须将来电往上转给主管。若主管没空或是无法处理，则 
将来电往上转给经理。请设计这个问题的类和数据结构，并实现一个 dispatchCall () 方法， 
将客户来电分配给第一个有空的员工 8 (第195页） 

8.3 运用面向对象原则，设计一款音乐点唱机。（第198页） 

8.4 运用面向对象原则，设计一个停车场。（第200页） 

8.5 请设计 在线囹 书阅读器系统的数据结构。 （ 第203页） 

8.6 实现一个拼图程序。设计相关数据结构并提供一种拼图算法 e 假设你有一个 fitsWith 方法， 
传人两块拼阁，若两块拼图能拼在一起，则返回 tr * ue 。 （第207页） 

8.7 请描述该如何设计一个聊天服务器。要求给出各种后台组件、类和方法的细节，并说明其中 
最难解决的问埋会是什么。 （ 第210页） 

8.8 “奥赛罗棋”（黑白棋）的玩法 如下： 每一枚棋子的一面为白，一面为黑。游戏双方各执黑， 
白棋子对决，当一枚棋子的左右或上下同时被对方棋子夹住，这枚棋子就算是被吃掉了，随 
即翻面为对方棋子的颜色。轮到你落子时，必须至少吃掉对方一枚棋子。任意一方无子可落 
时，游戏即告结束。最后，棋盘上棋子较多的一方获胜。请运用面向对象设计方法，实现“奥 
赛罗棋”。（第214页） 

8.9 设计一种内存文件系统 （ in-memory file system ) 的数据结构和算法，并说明具体做法。如有 
可行，请用代码举例说明。（第217 页） 

8.10 设计并实现一个散列表，使用链接（即链表）处理碰撞冲突。（第219页） 

参考 问題： 线程与锁 （#16.3) 。 

8.9 递归和动态规划 

尽管递归问題五花八门，但题型大都类似。一个问题是不是递归的，就看它能不能分解为子 
问题进行 求解。 

当你听到问题是这么开 头的： “设计一个算法，计算第#……”，"编写代码列 出前 ^ ……”， 
“实现一个方法，计算所有……”等等，那么，这基本上就是一个递归问题。 

熟能生巧！练习的越多，就越容易 IP 、 别递归问题。 

1.解决之道 

递归的解法，根据定义，就是从较小的子问题逐渐逼近原始问题。很多时候，只要在/ "( n - i ) 
的解法中加人、移除某些东西或者稍作修改就能算出/ '(/ I )。 而在其他情况下，答案可能更为复杂。 
你应该双管齐下，自下而上和自上而下两种递归解法都要考虑。简单构造法对递归问题就很 

奏效。 
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• 自下而上的递归 

自下而上的递归往往最为直观。首先要知道如何解决简单情况下的问题，比如，只有一个元 
素的列表，找出有两个、三个元素的列表的解法，依此类推。这种解法的关键在于，如何从先前 
解出来的答案，构建出后续情况的答案。 

• 自上而下的递归 

自上而下的递归可能比较复杂，不过对某些问题很有必要。遇到这类问题时，我们要思考如 
何才能将情况 M 的问题分解成多个子问题。同时要注意子问题是否®叠了 3 

2. 动态规划 

在面试中，动态规划 （ Dynamic programming , DP ) 问题很少问及，原因很简单，短短 45 分 
钟的面试要解决这类问題实在太难了。就算是出色的求职者，面对这类问题通常也难有上佳表现， 
因此动态规划问题不适合用来评估求职者。 

要是不走运，碰到了动态规划问题.你可以用跟递归问题差不多的解决方法来处理。区别在 
于，中间结果要“缓存”起来，以备后续使用。 

• 动态规划法简单 示例： 斐波那契數列 

下面举个动态规划法的简单例子。想象一下，面试官要求你实现一个程序，生成斐波那契数 
列的第 n 项数字。听起来很简单，对吧？ 

1 int fibonacci(int i) { 

2 if (i ■■ 0) return 0; 

3 if (i ■■ 1) return 1; 

4 return fibonacci(i - 1) ♦ fibonacci(i - 2); 

5 > 

这个函数要用多长时间执行？计算斐波那契数列第《项要先算出前面的/ »-1 项。而每次函数调 
用又包含两次递归调用，也就是说.执行时间为0(2")。下面 的阁表 显示在普通台式机上的执行 
结果，执行时间呈指数级上升。 



只要对上面的函数稍作修改，就可以将时间复杂度优化为 0(/ V )。 具体做法就是将每次调用 
fibonacci ( i ) 的结果“缓存”起来。 
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1 int[] fib = new int[nax]; 

2 int fibonacci(int i) { 

3 if (i == 0) return 0; 

4 if (i s* 1) return 1; 

5 if (fib[i] !* 0) return fib[i]; // 返曰先前緩存的结果 

6 fib[i] = fibonacci(i - 1 ) + fibonacci(i - 2); // 緩存结菜 

7 return fib[i]; 

8 } 

在普通电脑上，之前的递归版本生成第 50® 斐波那契数用时可能超过一分钟，而动态规划方 
法只需几毫秒就能产生第10 000项斐波那契数。当然，若采用上面这段代码， int 型变量很快就 
会溢出。 

如你所见，动态规划法没什么好怕的。只不过要缓存中间结果，比递归稍稍复杂些。解决这 
类问题，有个好办法就是先以一般的递归法实现.然后添加缓存部分。 

3. 递归和迭代解法 

递归算法的空间效韦很低。每次递归调用都会在找上增加-层，也就是说，若算法包含 
次递归调用，就要使用 0( rt ) 内存。不得了！ 

所有的递归代码都能改为迭代式的实现，尽管有时候这么做代码会复杂得多。在一头扎人递 
归代码之前，先问问自己用迭代方式实现会有多难.并与面试官讨论不 N 解法的优劣差样。 


面试题目 


9.1 有个小孩正在上楼梯，楼梯有《阶台阶，小孩一次可以上1阶、2阶或3阶。实现一个方法，计 
算小孩有多少种上楼梯的方式。（第221页） 

9.2 设想有个机器人坐在格的左上角，只能向右、向下移动^机器人从 (0,0) 到 ( A ； y ) 有多少 
种走法？ 

进阶 

假设苻些点为“禁区”，机器人不能踏足。设计一种算法，找出一条路径，让机器人从左上 
角移动到右下角 （ 第222页)。 

9.3 在数组 A [0... n -1] 中，有所谓的魔术索引，满足条件 A [ i ] = i 。 给定一个冇序整数数组，元 
素值各不相同，编写一个方法，在数组 A 中找出一个魔术索引，若存在的话。 

进阶 

如果数组元素有重复值，又该如何处理？（第224页） 

9.4 编写一个方法，返回某集合的所有子集。（第226页> 

9.5 编写一个方法，确定某字符串的所有排列组合。（第229页） • 

9.6 实现一种算法，打印对括号的全部有效组合（即左右括号正确配 对〉。 

示例 
输人： 3 

输出 ： .(（<))), (()()), (())(〉， ()(0), ()()0( 第230页） 
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9.7 编写函数，实现许多图片编辑软件都支持的“填充颜色”功能。给定一个屏幕（以二维数组 
表示，元素为颜色值）、一个点和一个新的颜色值，将新颜色值填人这个点的周围区域，直 
到原来的颜色值全都改变。 （ 第232页） 

9.8 给定数 M 不限的硬币，币值为25分、10分、5分和1分，编写代码计算"分有几种表示法 。（第 
232页） 

9.9 设计一种算法，打印八皇后在 8 x 8 棋盘上的各种摆法，其中每个皇后都不同行、不同列，也 
不在对角线上。这里的“对角线”指的是所有的对角线，不只是平分整个棋盘的那两条对角 
线。 （ 第234 页） 

9.10 给你堆 《个箱子，箱子宽％、高 A ,、 深4。箱子不能 翻转， 将箱子堆起来时，下面箱子的 
宽度、高度和深度必须大于上面的 箱子。 实现一个方法，搭出最高的一堆箱子，箱堆的髙 
度为每个箱子卨度的总和。 （ 第236 页） 

9.11 给定一个布尔表达式，由 0 、 1. &、 | 和 △ 等符号组成.以及一个想耍的布尔结果 result , 
实现一个函数，算出有儿种括号的放法使该表达式得出 result 值。 

示例 

表达式： 1 A 0|0|1 
期 ® 结果： false (0) 

输出: 1 A ((0|0>|1) 和 1 A (0|(0|1)> 两种方式（第238页） 

参考 问题： 链表 （#2.2、#2.5、 #2.7) ; 栈与队列 （#3.3) ; 树与图 （#4.1、#4,3、#4.4、#4.5、 
#4.7、#4.8、 #4.9) ; 位操作 （#5.7); 智力题 （#6.4) ; 排序与査找 （#11.5、#11.6、 #11.7, #11.8) ; 
C 和 C ++(#13.7) ; 中等难题（ #17.13、 #17.14) ; 高难度題 （#18.4、 #18.7, #18.12、#18.13)。 

8.10 扩展性与存储限制 

扩展性面试题看似吓人，其实这类问题算得上是最简单的。它们不会暗藏什么“陷阱 "，不 
会有什么花招，也不需要花哨的算法一至少通常不会有。你不需要学习分布式系统方面的课程， 
也不必具备系统设计的相关经验。只要稍加练习，任何心思缜密且够聪明的软件 T . 程师都能轻松 
搞定这些问题„ 

1.循序渐进法 

面试官并不是想考察你掌握了多少系统设计 知识； 实际上，除了考察最基本的计算机科学概 
念，面试官一般不会考具体的知识点。相反，他们想要评估的是你分解棘手问题的能力，以及用 
所学知识解决问题的能力。以下这些步骤有助于应对大多数系统设计问题。 

• 步驟丨：大胆假设 

假设一台计算机就能装下全部数据，且存储上没有任何限制。你会如何解决问题？由此得出 
的答案，可以为你最终解决问题提供基本思路。 

• 步驟 2 :切合实际 

现在，让我们回到问题本身。一台计算机究竟能装下多少数据，拆分这些数据会产生什么问 
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题？通常，我们需要考虑如何合理拆分数据，以及一台计算机需要不同的数据片段时，如何得知 
该去哪里査找，等等。 

• 步嫌 3: 解决问題 

最后，想一想该如何处理步骤2发现的问题。请记住，这些解决方案应该能彻底消除这些问 
题，或至少改善一下状况。通常情况下，你可以继续使用（进行一定修改）步骤1描述的方法， 
但偶尔也需要改弦易张，从根本上改变解决方案。 

请注意，迭代法通常很有用。也就是说，等你解决好步骤2发现的问题.可能又会冒出新问 
题，你还要着手处理这些新问题。 

你的目标不是重新设计公司耗资数百万美元搭建的复杂系统，而是证明你有能力分析和解决 
问题。检验自己的解法，四处挑错并予以修正，是个向面试官展现实力的不错方法。 

2 .你 需要知道的：信患、策略与问 S 

• 典型系统 

尽管仍有公司在使用大型机，可大多数互联网公司还是喜欢使用由普通计算机互联组成的大 
型系统。通常情况下，你可以假定自己就是在使用这种系统。 

面试之前，你最好填写下面的表格。利用这张表.可以估算出一台计算机可存储多少数据。 


组 件 

一败容置/败值 

硬盘空间 


内存 


网络传输延迟 



• 拆分大 t 的数据 

尽管有时我们可以增加计算机的硬盘空间，不过，难免会遇到必须将数据拆分至多台计算机 
的情形。随之而来的问题是，哪些数据要放在哪一台机器上。下面有几种策略可供参考。 

□ 按出现的顺序 

我们可以按出现的顒序直接划分数据。也就是说，有新数据进来时，先放进当前机器，填满 
之后，再加一台机器。这么做的好处是不会浪费资源。然而，根据具体问题和数据集的不同，査 
找表可能会变得非常复杂、异常巨大。 

□ 按散列值 

另一种做法是根据数据的散列值存放数据。具体一点来说，我们会采取以下 步骤： （1) 根据 
数据挑选某 种键； 利用散列函数得到键的散 列值； （3) 将散列值除以机器数量求得 余数； （4>将 
数据存储在这个值对应的机器上。也就是说，数据会存放在编号为 #[ mod ( hash ( key ), N )] 的机 

器上。 

这种做法的好处是不用创建数据査找表。每一台计算机自动掌握数据的存储位置。然而，这 
也会出问题，那就是某台机器的数据可能会多一些，并最终超出它的存储容量。若发生这种情况， 
可以将数据迁移到其他机器上，以实现更好的负载均衡（但幵销很大），或者将这台机器的数据 
拆分到两台机器上（形成一组树状结构的机器)。 
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□按实际值 

按散列值划分数据本质上是随 机的； 数据代表的具体意义与存储数据的机器之间，并不存在 
任何关系。在某些情况下，我们也许可以利用数据所代表的信息来降低系统延迟。 

例如，假设你正在设计一个社交网站。虽然人们的朋友会来自世界各地，但实际上，相比俄罗 
斯普通公民，住在墨西哥的人可能拥有更多来自墨西哥的朋友。或许，我们可以将“类似”数据存 
储在同一台机器上，这样在査找墨西哥人的朋友时，只需访问较少数量的机器就能取得相关资料。 

□ 随机存储 

通常情况下，我们只是随机划分数据，冉实现一个査找表以表明哪台机器拥有哪些数据。虽 
然这肯定需要一张巨大的査找表，但它简化了系统设计的某些方面，使我们得以实现更好的负载 
均衡。 

3.示 例： 査找所有包含某一组词的文件 

给定教百万份文件，如何找出所有包含某一组词的文件？我们不关心这些词出现的顺序，但 
它们必须是完整的单词。也就是说， “ book ” 与 “ bookkeeper ” 不是一回事。 

在着手解决问题之前，我们需要考虑 findWords 程序只用一次，还是要反复调用。假设需要 
多次调用 findVtofds 程序来扫描这些文件，那么，我们可以接受预处理的开销。 

• 步驟1 

笫一步是先忘记我们有数以百万计的文件，假装只有几十个文件。在这种情况下，如何实现 
findWords 呢？（提 示： 不要急#看下文.先试着 fj 己解解肴。） 

一种方法是预处理每个文件，并创建一个散列表的索引。这个散列表会将词映射到含有这个 
词的一组文件。 

w books w -> {doc2, doc3, doc6, doc8) 

“many” -> {docl, doc3, doc7, doc8, doc9> 

若要査找 “many books ”， 只需对 “ books ，^« n » an 广 的值进行交集运算，于是得到结果 { doc 3, 
doc 8} 0 

• 步驟2 

现在，回到最初的问题。若有数百万份文件，会有什么问题？首先，我们可能需要将文件分 
散到多台机器上。此外.我们还要考虑很多因素，比如要査找的单词数 M 、 在文件中重复出现的 
次数等，一台机器可能放不下完整的散列表。假设我们就要按这个限制进行设计。 

文件分散到多台机器上会引出以下几个很关键的关注点。 

(1) 如何划分该散列表？我们可以按关键字划分，例如，某台机器上存放有包含某个单词的 
全部文件。或者，可以按文件来划分，这样一台机器上只会存放对应某个关键字的部分文件，而 
非全部。 

(2) —旦决定了如何划分数据，我们可能需要在一台机器上对文件进行处理，并将结果推 
送到其他机器上。这个过程会是什么呢？（注 意： 若按文件划分散列表，这一步可能就没有 
必要。） 
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(3) 我们需要找到一种方法获知》台机器拥冇哪些数据。这个査找表会是什么样的？又该存 
储在什么地方？ 

这只是其中 F 个，可能还会有更多其他的关注点。 

• 步驟3 

在步骤3中，我们要找出解决这些关注点的解决方案。其中一种解法是按字母顺序划分不同 
的关键字，这样，每台机器便可以处理一串同。例如，从 " after ” 直到 " apple *% 

我们可以实现一个简单的算法，按字母顺序遍历所有关键字，并尽可能多地将数据存储在一 
台机器上。当这台机器的空间被占满之后，我们便转到下一台机器。 

这种方法的优点是査找表会比较小而且简单（因为它只箱包含一系列指定的值），每台机器 
可存储一份査找表的副本。然而，不足之处在于新增文件或单词时，我们可能需要改变关键字的 
位置，这么做开销很大。 

为丫找到匹配某一组字符串的所有文件，我们会先对这一组字符串进行排序，然后给每一台 
机器发送与字符对应的査找请求。例如，若待査字符串为 "after builds boat amaze banana ”， 
一号机器就会接收到査找 {“ after **, “ amaze **} 的清求。 

一号机器开始査找包含 " after - 与 “ amaze *^ 文件.并对这些文件执行交集运算。•:号机器 
则处理 {" banana **, " boat **, " builds »} S 儿个关键字，同样也会对文件进行交集运算。 

最后，发送请求的 机器样 对一号机器及 三号机 器返回的结果作交集运算。 

下图描述了整个过程。 


"after builds boat amaze banana ” 

Machine 1: "after amaze" 


"after” -> docl, docs, doc7 
**amaze M -> doc2, doc5, doc7 


I Machine 3: "builds boat banana' 1 


"builds" -> doc3, doc4, doc5 
"boat” -> doc2, doc3, doc5 
"banana” -> doc3, doc4, doc5 


{ does , doc 7) I I _ { doc 3, doc 5} 


solution = does 


面试题目 


10.1 假设你正在搭建某种服务，有多达1000个客户端软件会调用该服务，取得每天盘后股票价 
格信息（开盘价、收盘价、最高价与最低价)。假设你手里已有这些数据，存储格式可自行 
定义。你会如何设计这套面向客户端的服务，向客户端软件提供信息？你将负责该服务的 
研发、部署、持续监控和维护，描述你想到的各种实现方案.以及为何推荐采用你的方案。 
该服务的实现技术可任选，此外，可以选用任何机制向客户端分发信息。（第241页） 
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10.2 你会如何设计诸如 Facebook ^ Linkedln 的超大型社交网站？请设计一种算法，展示两个人之 
间的“连接关系”或“社交路径”（比如，我—鲍勃 —苏珊 — 杰森 — 你)。（第243页） 
10.3 给定一个输人文件，包含40亿个非负整数，请设计一种算法，产生一个不在该文件中的整 
数。假定你有 1 GB 内存来完成这项任务。 

进阶 

如果只有 10 MB 内存可用，该怎么办？假定所有值都是唯一的。（第240页） 

10.4 给定一个数组，包含1到 yv 的整数， A / 最大为32 000,数组可能含有重复的值，且 A 酌取 值不 
定。若只有 4 KB 内存可用，该如何打印数组中所有重复的元素。（第248页） 

10.5 如果要设计一个网络爬虫程序，该怎么避免陷人无限循环？（第249页） 

10.6 给定100亿个网址，如何检测出重复的文件？这里所谓的"重复“是指两个 URL 完全相同。 
(第250页） 

10.7 想象有个 Web 服务器，实现简化版搜索引擎。这套系统有100台机器来响应搜索査询，可能 
会对另外的机器集群调用 processSearch(string query ) 以得到真正的结果。响应査询请 
求的机器是随机挑选的，因此两个同样的请求不一定由同一台机器响应。方法 
processSearch 的丌销很大，请设计一种缓存机制，缓存最近几次査询的结果。 当数倨 发 
生变化时，务必说明该如何更新缓存。（第251 页〉 


参考 问題： 面向对象设计 （ #8.7 >。 

8.11 排序与查找 

花时间学习掌握常见的排序和丧找算法，回报巨大.很多排序与査找问题，实际 I •.只是将大 
家熟悉的算法稍作修改 时已。 因此.处理这类问题的诀转就是逐一考虑各种不同的排序算法，看 
肴哪一种特别合适。 

举个例子，假设你被问到如下 问题： 给定一个含有 Person 对象且非常大的数组，请按年龄从 
小到大对数组元素进行 排序。 

根据题 H , 有以下两点值得 注意： 

(1) 数组很大，所以效率非常 重要； 

(2) 根据年龄排序，所以这些数值的范围较小。 

检查各种排序算法，可能会注怠到“桶排序”（或称基数排序），特别适用于这个问题。事实 
上，我们用到的桶子数目并不多（一个年龄对应一个），最终执行时间为 
1.常见的排序算法 

学习（或复习）常见的排序算法是提升自身水平的绝佳方式。下面介绍的五种算法中，归并 
排序 （ MergeSort )、 快速排序 （ Quicksort ) 和基数排序 （ RadixSort ) 是面试中最常用的三种。 

• 冒泡排序 | 执行 时间： 平均情况与最差情况为存储 空间： 0(1) 

冒泡排序 （ BubbleSort ) 是先从数组第一个元素开始，依次比较相邻两个数，若前者比后者 
大，就将两者交换位置，然后处理下一对，依此类推，不断扫描数组，直到完成排序。 
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• 选择排序 | 执行 时间： 平均情况与最差情况为 OCn 2 ), 存储 空间： 0(1) 

选择排序 （ SelectionSort ) 有点“小儿 科”： 简单而低效。我们会线性逐一扫描数组元素，从 
中挑出最小的元素，将它移到最前面（也就是与最前面的元素交换)。然后，再次线性扫描数组， 
找到第二小的元素，并移到前面。如此反复，直到全部元素各归其位。 

• 归 并排序 | 执行 时间： 平均情况与最差情况为存储 空间： 看情况 
归并排序是将数组分成两半，这两半分别排序后，再归并在一起。排序某一半时，继续沿用 
同样的排序箅法，最终，你将归并两个只含一个元素的数组。这个算法的重担都落在“归并”的 
部分上。 

在下面的代码中. merge 方法会将目标数组的所有元索拷贝到临时数组 helper 中.并记下数 
组左、右两半的起始位置 （ helperLeft 和 helperRight )。然后，迭代访问 helper 数组，将左右 
两半中较小的元素，复制到目标数组中。最后，再将余下所有元素复制回目标数组。 

1 void iiergesort(int[] array, int low, int high) { 

2 if (low < high) { 

3 int middle = (low ♦ high) / 2; 

4 «ergesort(array, low, middle); // 棑序左半部分 

5 mergesort(array, middle + l, high); // 排年右半部分 

6 merge(array, low, middle, high); // 并 

7 > 

8 > 

9 

10 void merge(lnt [】 array, int low, int middle, int high) { 

11 int [] helper - new int[array.length]; 

12 

13 /* 将数組左右兩半拷 « 到 helper 数奴中 •/ 

14 for (int i ■ low; 1 <■ high; i++) { 

15 helper[1] * array[i]; 

16 > 

17 

18 int helperLeft » low; 

19 int helperRight * middle + 1; 

20 int current - low; 

21 

22 /* 速代访问 helper 數 to. 比杖左、右两半的元索， 

23 • 并将较小的元索复制利原先的数 tt 中。 

24 •/ 

25 while (helperLeft <* middle && helperRight <■ high) { 

26 if (helper[helperLeft] <- helper[helperRight]) { 

27 array[current] ® helper[helperLeft]; 

28 helperLeft++; 

29 } else { // 如果右边的元素小于左边的元索 

30 array[current] * helper[helperRight]; 

31 helperRight+4-; 

32 > 

B3 current++; 

34 > 

35 

36 /* 将数組左半部分余元素 

37 * 复制到目标数纽中 */ 

38 int remaining = Middle - helperLeft; 
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39 for (int i = 0; i <= remaining; i++) { 

40 array[current + i] = helper[helperLeft + i]; 

41 > 

42 } 

43 public static void mergesort(int[] array) { 

44 int[] helper = new int[array.length]; 

45 mergesort(array, helper, 0, array.length - 1); 

46 } 

你可能会发现，上述代码只是将 helper 数组左半部分剩余元素，复制回目标数组中。为什么 
不复制右半部分的呢？那是因为这部分元素早已在目标数组中，无需复制。 

下面以数组 [1, 4, 5 11 2, 8, 9] (符号 T 表示分界点）为例进行说明。在合并左右两 
部分的元素之前， helper 数组与目标数组末尾都是 [8, 9]。将4个元素（丨、4、5和2 > 复制到目 
标数组时， [8, 9] 仍在原处。所以，也就不需要复制这两个元素。 

• 快速排序 | 执行 时间： 平均情况为 0( nlog ( n )). 最差情况为 0(/ i 2 ), 存储 空间： 0( log ( n )) 
快速排序是随机挑选一个元素，对数组进行分割，以将所有比它小的元素排在前面，比它大 
的元素则排在后面。这里的分割经由一系列元素交换的动作完成（见下文)。 

如果我们根据某元素再对数组（及其子数组）进行分割，并反复执行，最后数组就会变成有 
序的。然而，因为无法确保分割元紊就是数组的中位数（或接近中位数），快速排序的效串 h ] •能 
会非常低下，这也是为什么最差悄况时间复杂度为的原 W 。 

1 void quicksort(int arr[], int left, int right) { 

2 int index ■ partition(arr, left, right); 

3 if (left < index •!){// 排序左半部分 

4 quickSort(arr, left, index - 1); 

5 } 

6 if (index < right) {" 排序右半_分 

7 quickSort(arr, index, right); 

8 > 

9 > 

10 

11 int partition(int arr【], int left, int right) { 

12 int pivot = arr[(left + right) / 2 ]; // 挑出一个基准点 

13 while (left <* right) { 

14 // 找出左边中应被放到右边的元索 

15 while (arr[left] < pivot) left++; 

16 

17 // 找出右边中应被放到左边的元索 

18 while (arr[right] > pivot) right--; 

19 

20 // 交糗元素，同时调整左右索幻值 

21 if (left <= right) { 

22 swap(arr, left, right); // 交糗元素 

23 left++; 

24 right--; 

25 

26 
27 



29 


return left; 
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• 基数排序 | 执行 时间： 0( 知）（见下文） 

基数排序是个整数（或其他一些数据类型）排序算法，充分利用整数的位数有限这一事实。 
使用基数排序时，我们会迭代访问数字的每一位，按各个位对这些数字分组。比如说，假设有一 
个整数数组，我们可以先按个位对这些数字进行分组，于是，个位为0的数字就会分在同一组里。 
然后, 冉按十位进行分组，如此反复执行同样的过程，逐级按更高位进行排序，直到最后整个数 
组变为有序数组。 

其他比较算法的平均情况执行时间不会优于 0(/* log (/»)), 相比之下，基数排序的执行时间为 
( Kkn ), 其中》为元素个数. / t 为数字的位数。 

2. 查找算法 

提到査找算法时，我们一般都会想到二分査找法。这个算法的确非常有用，值得研习。在二 
分査找中，要在有序数组里査找元素 x , 我们会先取数组中间元素与#比较。若 x 小于中间元索， 
则搜索数组的左半部。若 x 大于中间元索，则搜索数组的右半部。然后，重复这个过程，将左半 
部和右半部视作子数组继续捜索。我们再次取这个子数组的中间元素与:比较，然后搜索左半 
部或右半部。我们会重复这一过程，直至找 Pk 或子败组大小为0。 

概念上似乎很简单，但要真正掌握全部细节，却比你想象的还要闲难。研读以下代码时，请 
注意哪里要加 1. 哪里要减1。 


it binarySearch(int[] in 
int low - 0; 

int high ■ a.length - 1; 


rhile (low <* high) 
mid s (low * high) 
if (a[mid] < x) { 
low * mid * 1; 

} else if (a[nid] > x) 
high > nid - 1; 


2； 


I -1 ； // 錯误 


1 int binarySearchRecursive(int[] a, int 
if (low > high) return -1; // 错误 

int mid = (low + high) / 2; 
if (a[_id】< x) { 

return binarySearchRecurslve(a, x 
} else if (a[mid] > x) { 

return binarySearchRecursive(a, x 


: high) 


high); 

1 - 1 ); 
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除了二分査找法，还有很多种査找数据结构的方法，总之，我们不要拘泥于二分査找法。比 
如说，你可以利用二叉树或使用散列表来査找某结点。尽情开拓思路吧！ 


面试题目 


11.1 给定两个排序后的数组 A 和 B . 其中 A 的末端有足够的缓冲空容纳 B = 编写一个方法，将 B 合 
并人 A 并排序。（第255页） 

11.2 编写一个方法，对字符串数组进行排序，将所有变位词排在相邻的位賈。（第256页） 

11.3 给定一个排序后的数组，包含#整数，但这个数组已被旋转过很多次，次数不详。请编写 
代码找出数组屮的某个元素。可以假定数组元索原先是按从小到大的顺序排列的。 

示例 

输人： 在数组 {15, 16, 19, 20, 2 S , 1, 3, 4, S , 7, 10, 14} 中找出5。 

输出： 8 ( 元素5在该数组中的索引 ）（ 第257 页} 

11.4 设想你有个 20 GB 的文件，每一行一个字符串。请说明将如何对这个文件进行排序,,（第258 
页） 

11.5 有个排序后的字符串数组，其中散布着一些空字符串，编 H —个方法，找出给定字符串的 
位置。 

示例 

输入： 在字符串数组“”， " ball **, " car ”， “”， « dad w , nu , 

中，査找 " ball ”。 

输出： 4 ( 第259页） 

11.6 给定 WxW 矩阵，每一行、每一列都按升序排列，»编写代码找出某元素。（第260页） 

117有个马戏团正在设计叠罗汉的表演节目，一个人要站在另一人的肩膀上。出于实际和美观 
的考虑，在上面的人要比下面的人矮一点、轻一点。已知马戏团每个人的高度和 mM , 请 
编写代码计算叠罗汉 M 多能叠几个人。 

示例 

输人 （ ht , vrt )： (65, 100) (70, 150) (56, 90) (75, 190) (60, 95) (68, 110) 

输出:从上往下数.叠罗汉最多能叠 6 层： （ S 6 , 90) (60,95) (65,100) (68,110) (70,150) 
(75,190) (第2« 页） 

11.8 假设你正在读取一中整数。每隔一段时间，你希望能找出数字； t 的秩（小于或等于: t 的值的 
数 目）。 请实现数据结构和算法支持这些操作，也就是说，实现 track(int x ) 方法，每读 
人一个数字都会调用该方法；以及 getRankOfNumber(int x ) 方法，返回值为小于或等于 x 
的元素个数（不包括 x 本身)。 

示例 

数据流为（按出现的先后顺序> : S , 1, 4, 4, 5, 9, 7, 13, 3 
getRankOfNumber ( l ) = 0 
getRank 0 fNumber (3) = 1 
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getRankOf Number (4) = 3( 第267页） 

参考 问题： 数组与字符串 （# U ); 递归 （#9.3); 中等难題（#17.6、 #17.12); 高难度題（#18.5)。 

8.12 测试 

在念叨着“我又不是测试员”准备跳过本章之前，请你三思。对于软件工程师来说，测试是 
项很重要的工作，因此，在面试中你很可能会碰到测试问题。当然，如果你刚好要应聘测试职位 
(或软件测试工程师)，那就更应该好好研读本章。 

测试问题一般分为以下四类： （ U 测试现实生活中的事物 （ 比如一支笔）； （2) 测试一套软 
件； （3) 编写代码测试一个 函数； （4) 调试解决已知问题。针对每一类题型，我们都会给出相应 
的解法。 

请记住.处理这四类问题时，切勿假设使用者会好好地正常操作。请做好应对用户误用乱用 
软件的准备。 

1. 面试官想考察什么 

表面上看，测试问题主要考察你能否想到周全完备的测试用例。这在某种程度上也是对的， 
求职者确实需要想出--系列合理的测试用例。 

但除此之外，面试官还想考察以下几个方面。 

□ 全 局观： 你是否真的了解软件是怎么回亊？你能否正确区分测试用例的优先顺序？比如 
说，假设你被问到该如何测试像亚马逊这样的电子商务系统。若能确保产品图片显示位 
置正确，当然也不错，但最重要的还是确保支付流程万无一失，货品能顺利地进人发货 
流程，并且顾客绝对不能被 S 复扣款。 

口懂 整合： 你是否了解软件的工作原理？该如何将它们整合成更大的软件生态系统？假设 
要测试谷歌电子表格 （ Spreadsheets ), 你自然会想到测试文档的打开、存储及编辑功能。 
但是，实际上，谷歌电子表格也是大型软件生态系统的®要组成部分之一。所以，你还 
需将它与 Gmail 、 各种插件和其他模块整合在一起进行测试。 

□会 组织： 你能否有条有理地处理问题？还是处理问题时毫无条理？被要求提出照相机的 
测试用例时，有些求职者只会一股脑儿倒出一些杂乱无章的想法。而优秀的求职者却能 
将测试功能分为几类.比如拍照、照片管理、设罝，等等。在创建测试用例时，这种结 
构化处理方法还有助于你将 I .作做得更周全。 

□ 可 操作： 你制定的测试计划是否合理，行之有效？比如，如有用户报告，软件会在打开 
某张图片时崩溃，而你却只是要求他们重新安装软件，这显然太不实际了。你的测试计 
划必须切实可行，便于公司操作落实。 

倘若能在面试中充分展现这些方面，那么，你无疑就是任何测试团队所梦寐以求的重要一员。 

2. 测试现实生活中的事物 

问及该如何测试一支笔时，有些求职者会感到莫名惊诧。毕竟，你要测试的不是软件吗？没 
错’但这些关于“现实生活"的问题其实很常见。我们先来看看下面这个例子吧！ 
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比如有这么一个 问題： 如何测试一枚回形针？ 

* 步*1:使用者是哪些人？做什么用？ 

你需要跟面试官讨论一下，谁会使用这个产品，做什么用。回答可能出乎你的意料，比如， 
回答可能是“老师，把纸张夹在一起”或“艺术家，为了弯成动物的造型”。又或者，两者皆要 
考虑。这个问题的答案.将影响你怎么处理后续问题。 

• 步蠊2:有哪些用例？ 

列出回形针的一系列用例，这对解决问题很有帮助。在这个例子中，用例可能是，将纸张固 
定在一起，且不得破坏纸张。 

若是其他问题.可能会有多个用例。比如，某产品要能够发送和接收内容，或擦写和删除功 
能，等等。 

• 步 *3: 有哪些使用限制？ 

使用限制可能是，回形针一次可以夹最多 30 张纸，且不会造成永久性损害（比如弯掉），另 
外，可以夹 30 到 50 张纸时，只不过会发生轻微变形。 

同时，使用限制也要考虑环境 因家。 比如， 间形 针可否在非常温暧的环境下 （33 ~43 摄氏度） 
使用？在极寒环境下呢？ 

• 步骤4:压力与失效情况下的状态如何？ 

没有产品是万无一失的，所以，在测试中，还必须分析失效情况。跟面试官探讨时，最好问 
—下在什么情况下产品失效是可接受的 （ 甚至是必要的），以及什么样才算是失效。 

举个例子，要你测试一台洗衣机.你可能会认为洗衣机至少要能洗 30 件 T 恤衫或裤子。一次 
放进 30 到 45 件衣服，可能会导致轻微失效，因为衣物洗得不够干净。若超过 45 件衣物，出现极端 
失效或许可以接受。不过，这里所谓的极端失效，应该是指洗衣机根本不该进水，绝对不应该让 
水溢出来或引发火灾。 

• 步 *5: 如何执行測试？ 

有些情况下，讨论执行测试的细节可能很重要。比如，若要确保一把椅子能正常使用 5 年， 
你恐怕不会把它放在家里，等上 5 年再来看结果。相反，你需要定义何谓“正常"使用情况（每 
年会在椅子上坐多少次？扶手呢？）。然后，除了做一些手动测试，你可能还会想到找台机器， 
自动执行某些功能测试。 

3. 测试一 套软件 

测试软件与测试现实生活的事物非常相似。主要差异在于，软件测试往往更强调执行测试的 
细节。 

请注意，软件测试主要有如下两个方面。 

□手动测试与自动化 测试： 理想情况下，我们当然希望能够自动化所有的测试工作，不过 
这不太现实。有些东西还是手动测试来的更好，因为某些功能对计算机而言过于定性， 
计算机很难有效地检査（比如，内容带有淫秽色情成分)。此外，计算机只能机械地识别 
明确告知过的情况，而人类就不一样了，通过观察可能发现亟待验证的新问题。因此， 
在测试过程中，无论是人工还是计算机’两者都不可 或缺。 


80 第 8 章面试考題 


□黑盒测试与白盒 测试： 两者的区别反映了我们对软件内部机制的掌控程度。在黑盒测试 
中，我们只关心软件的表象，并且仅测试其功能，而在白盒测试中，我们会了解程序的 
内部机制，还可以分别对每一个函数单独进行测试。我们也可以自动执行部分黑盒测试， 
只不过难度要大得多。 

下面介绍一种测试方法，并从头到尾细述一遍。 

* 步 *1: 要做黑盒測试还是白盒测试？ 

尽管通常我们会拖到测试后期才考虑这个问题，但我喜欢早点做出选择。不妨跟面试官确认 
一下，要做黑盒测试还是白盒测试一或是两者都要。 

• 步 *2: 使用者是哪些人？做什么用？ 

一般来说，软件都会有一个或多个目标用户，设计各个功能时，就会考虑用户需求。比如， 
若要你测试一款家长用来监控网页浏览器的软件，那么，你的 B 标用户既包括家长（实施监控过 
滤哪些网站），又包括孩子（有些网站被过滤了）。用户也可能包括“访客"（也就是既不实施也 
不受监控的使用者)。 

• 步 *3: 有哪些用例？ 

在监控过滤软件中，家长的用例包括安装软件、更新过滤网站清单、移除过滤网站，以及供 
他们自己使用的不受限制的网络。对孩子而言，用例包括访问合法内容及“非法”内容。 

切记，不可凭空想象来决定各种用例.应该与面试官交流讨论后确定。 

• 步 *4: 有哪些使用限制？ 

大致定义好用例后，我们还需找出确切的意思。“网络被过滤屏蔽"具体指什么？只过滤屏 
蔽“非法"网页还是屏蔽整个网站？是否要求该软件 ft 备“学习”能力.从而 iR 别不良内容，抑 
或只是根据白名单或黑名单进行过滤？若要求具备学习能力并自动识别不良内容，允许多大的误 
报漏报率？ 

• 步 *5: 压力条件和失效条件为何？ 

软件的失效是不可避免的，那么，软件失效应该是什么样的？显然，就算软件失效了，也不 
能导致计算机岩机。在本例中，失效可能是软件未能屏蔽本该屏蔽的网站，或是屏蔽本来允许访 
问的网站。对于后一种情况，你或许应该与面试官讨论一下，是不是要让家长输人密码，允许访 
问该网站。 

• 步 *6: 有哪些测试用例？如何执行刪试？ 

这里才是手动测试和自动测试以及黑盒测试和白盒测试真正显示出差异的地方。 

在步骤3和步骤4中，我们初步拟定了软件的用例.这里会进一步加以定义，并讨论该如何执 
行测试。具体需要测试哪些情况？其中哪牲步骤可以自动化？哪些又需要人工介人？ 

请记住，在有些澜试中，虽然自动化可以助你一臂之力，但它也有着重大缺陷。一般来说， 
在测试过程中，手动测试还是少不了的。 

对着上面的清单一步步解决问題时，请不要想到什么就草率吐露。这会显得很没有条理，而 
且你肯定会遗漏重要环节。相反，你应该组织好自己的思路，先将测试工作分割为几个主要模块， 
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然后逐一展开分析。这样，不仅可以给出一份更完整的测试用例清单，而且也显得你做事有层次、 
有条理。 

4. 测试一个函数 

基本上，测试函数是测试中最简单的一种，与面试官的交流相对也会比较简短、清晰，因为， 
测试一个函数通常不外乎就是验证输人与输出。 

话说回来，千万不要忽视与面试官交流的重要性。对于任意可能，特别是如何处理特定情况， 
你都应该深究到底。 

假设要你编写代砰测试对整数数组排序的函数 sort ( int [] array ) ,可参考下面的解决步骤。 

• 步驟1:定义测试用例 

—般来说，你应该考虑以下儿种测试用例。 

□正常 情况： 输人正常数绀时，该函数是否能生成正确的输出？务必记得考虑其中的潜在 
问题„比如，排序通常涉及某种分荆处理，应该要合理的想一想，数组元索个数为奇数 
时，由于无法均分数组，算法坷能无法处理。所以，测试用例必须涵盖元岽个数为偶数 
与奇数的两种数组。 

□ 极端 情况： 传人空数组会出现什么问题？或传人一个很小的数组（只有一个元 素）？ 此 
外，传人非常大数组又会如何呢？ 

□空指针和“非法” 输入： 值得花时间好好考虑一番，荇函数接收到非法输人，该怎么处 
理。比如，你在测试生成第《项斐波那契数的函数，那么，在测试用例中， A 然要考虑《 
为负数的情况。 

□ 奇怪的 输入： 第四种有可能出现的 情况： 奇怪的 输人。 传人一个有序数组会怎么样？或 
者, 传人一个反向排序的数组呢？ 

只有充分了解函数功能，才能想到这些测试用例。如果你对各种限制条件不是很清楚.最好 
先向面试官问个淸楚。 

參步驟2:定义预期结果 

通常，预期结果非常 明显： 正确的输出。然而，在某些情况下，你可能还需要验证其他情况。 
比如，如果 sort 函数返回的是一个已排序的新数组，那么，你可能还要验证一下原先的数组是否 
保持原样。 

• 步骤3:编写测试代码 

有了测试用例，并定义好预期结果后，编写代码实现这些测试用例，也就水到渠成了。代码 
大致 如下： 

1 void testAddThreeSorted() { 

2 MyList list = new MyList(); 

B list.addThreeSorted(3, 1, 2); // 按順序添加 3 个元索 

4 assertEquals(list.getElement(0), 1); 

5 assertEquals(list.getElement(l), 2); 

6 assertEquals(list.getElement(23); 
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5. 调试与故陣排除 

测试问题的最后一种是，说明你会如何调试或排除已知故障。碰到这种问题，很多求职者都 
会支支吾吾，处理不当，给出诸如“重装软件”等不切实际的答案。其实，就像其他问题一样， 
还是有章可循的，也可以有条不紊地处理。 

下面通过一个例子辅助说明，假设你是谷歌 Chrome 浏览器团队的一员，收到一份 bug 报告： 
Chrome 启动时会崩溃。你会怎么处理？ 

重新安装浏览器或许就能解决该用户的问题，但是，若其他用户碰到同样问题，怎么办？你 
的目标是搞清楚究竟出了什么问题，以便开发人员修复缺陷。 

* 步驟丨：理清状况 

首先，你应该多提问题，尽最了解当时的 情况： 

□ 用户碰到这个问题有多久了？ 

□ 该浏览器的版本号？在什么操作系统下运行？ 

□该问题经常发生吗？或者，出问题的频率有多高？什么时候会发生？ 

□ 有无提交错误报告？ 

* 步骤 2: 分解问《 

了解广问埋发生时的具体状况，接下来，着手将问题分解为可测模块。在这个例子中，可以 
设想出以下操作步骤。 

⑴转到 Windows 的“开始”菜单。 

(2) 点击 Chrome 阁标。 

(3) 浏览器启动。 

(4) 浏览器载入参数设置。 

(5) 浏览器发送 HTTPfil 求载人首页。 

(6) 浏览器收到 HTTP 回应。 

(7) 浏览器解析 W 贞。 

(8) 浏览器显示网页内容。 

在上述过程中的某一点,有地方出错致使浏览器崩溃。优秀的测试人员会逐一排査每个步骤， 
诊断定位问题所在。 

• 步嫌3:创建特定的、可控的测试 

以上各个测试模块都应该有实际的指令动作一也就是你要求用户执行的、或是你自己可以 
做的操作步骤（从而在你0己的机器上予以重现)。在真实世界中，你面对的是一般客户，不可 
能给他们做不到或不愿做的操作指令。 


面试题目 _ 

12.1 找出以下代码中的错误（可能不止一 处）: 

1 unsigned int i; 

2 for (i = 100 ; i >= 0 ; --i) 

3 printf( **%d\n«, i); ( 第 269 頁〉 
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12.2 有个应用程序一运行就崩溃，现在你拿到了源码。在调试器中运行10次之后，你发现该应 
用每次崩溃的位置都不一样。这个应用只有一个线程，并且只调用 C 标准库函数。究竟是什 
么样的编程错误导致程序崩溃？该如何逐一测试每种错误？ （ 第270页） 

12.3 有个国际象棋游戏程序使用了方法 ： boolean canMoveTo(int x , inty ), 这个方法是 Piece 
类的一部分，可以判断某个棋子能否移动到位置 Or , y )。 请说明你会如何测试该方法。（第 
271 页） 

12.4 不借助任何测试工具，该如何对网页进行负载测试？（第272页） 

12.5 如何测试一支笔？（第272页） 

12.6 在一个分布式银行系统中，该如何测试一台 ATMtt ( 自动柜员 机）？ （第273页〉 


8.13 C 和 C ++ 


好的面试官不会要求你用自己不懂的语言来编写代码。一般来说，如果面试官要求你用 C # 
写代码，那么，应该是你在简历上提及了 C ++。要是没能记住所有 API , 也不用担心，大部分面 
试官（虽不是全部）并不会那么在意这一点。不过，我们仍建议你学会基本的 C ++ 语法，这样才 
能轻松应对这些问题。 

1. 类和继承 

虽然 C + +的类与其他语言的类有些特征相似，不过，还是有必要冋顾一下相关部分语法。 
下面的代码演示了怎样利用继承实现一个基本的类。 


1 #include <iostream> 

2 using namespace std; 

3 

4 #define NAME.SIZE 50 // 定义一个宏 

5 

6 class Person { 

7 int id; II 所有成员双认为私有 (private) 

8 char nane[NAME_SIZE]; 

9 

10 public: 

11 void aboutMe() { 

12 cout << **I am a person.**; 

13 } 

14 }; 


16 class Student : public Person { 

17 public: 

18 void aboutfie() { 



21 }； 


2B int nain() { 

24 Student * p = new Student(); 

25 p->aboutMe(); // 打印 am a student.” 
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26 delete p; // 注意！务必鋒放之前分 fc 的内存 

27 return 0; 

28 > 

在 C ++ 中，所有数据成员和方法均默认为私有 （ private )， 可用关键字 public 修改其属性。 

2. 构造函数和析构函数 

对象创建时，会自动调用类的构造函数。如果没有定义构造函数，编译器会自动生成一个默 
认构造函数 （ DefaultConstructor )。 另外，我们也可以定义自己的构造函数。 

1 Person(int a) { 

2 id ■ a; 

3 } 

这个类的数据成员也可以这样初 始化： 

1 Person(int a) : id(a) { 


在真正的对象创建之前，且在构造函数余下部分代码调用前，数据成员 id 就会被陚值。在常 
a 数据成员陚值时 （ 只能陚一次值），这种写法特别适用。 

析构函数会在对象删除时执行清理丁.作。对象销毁时，会自动调川析构闲数。我们不会显式 
调用析构函数，因此它不能带参数。 


1 ^PersonO { 

2 delete obj; // 释放之前这个美置分 fc 的内4 

3 > 

3.虚函数 

在前面的例子中，我们将 p 定义为 Student 类型指针变 fi : 

1 Student * p ■ new Student(); 

2 p->aboutMe(); 

像下面这样，把 p 定义为 Person * 又会怎么样？ 

1 Person ♦ p ■ new Student(); 

2 p->aboutMe(); 

这么改的话，执行时会打印 “I am a person % 这是因为函数 aboutMe 是在编译期决定的, 
也即所谓的静态挪定 （static binding ) 机制。 

若要确保调用的是 Student 的 aboutMe 函数实现，可以将 Per son 类的 aboutMe 定义为 virtual : 


virtual void aboutMe() { 
cout « M I an a person. w ; 


8 class Student : public Person { 

9 public: 

10 void aboutMe() { 
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11 cout « W I am a student. w ; 

12 } 

13 }； 

当我们无法（或不想）实现父类的某个方法时，虚函数也能派上用场。例如，设想一下，我 
们想让 Student 和 Teacher 继承自 Person, 以便实现一个共同的方法，如 addCourse(string s) 0 
不过，对 Person 调用 addCourse 方法没有多大意义，因为要看对象到底是 Student 还是 Teacher, 
才能确定该调用哪个方法的具体实现。 

在这种情况下，我们可能想将 Person 类的 addCourse 定义为虚函数，至于函数实现则留给 

子类。 

1 class Person { 

2 int id; // 所有成 8 蔌认为私有 

3 char name[NAME_SIZE] ; 

4 public: 

5 virtual void aboutMe() { 

6 cout « M I am a person. w « endl; 

7 } 

8 virtual bool addCourse(string s) - 0; 

9 >； 

10 

11 class Student : public Person { 

12 public: 

13 void aboutMe() { 

14 cout << "I am a student. w << endl; 

15 } 

16 

17 bool addCourse(string s) { 

18 cout << “Added course w << s « ** to student. w << endl; 

19 return true; 

20 > 

21 }; 

22 

23 int main() { 

24 Person * p = new Student(); 

25 p->aboutHe(); // 打印 “I am a student. w 

26 p->addCourse( ,, History w ); 

27 delete p; 

28 } 

注意，将 addCourse 定义为纯虚函数， Person 就成了一个抽象类，不能实例化。 

* 虚析构函教 

有了虚函数，很自然地就会出现虚析构函数的概念。假设我们想要实现 Person 和 Student 的 
析构函数。不假思索的话，可能会写出类似如下的 代码： 

1 class Person { 

2 public: 

3 -Person() { 

4 cout << “Deleting a person." << endl; 


6 }； 
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class Student : public Person 
public : 

» 〜 Student() { 

cout << “Deleting a studei 


15 int main() { 

16 Person * p = new Student(); 

17 delete p; // 打印 ’’Deleting « 


跟之前的例子一样，由于指针 p 指向 Person . 对象销毁时 ft 然 会谰用 Person 类的析构函数。 
这样就会有问题，因为 Student 对象的内存可能得不到释放。 

要解决这个问题，只需将 Person 的析构函数定义为虚析构函数。 

1 class Person { 

2 public : 

3 virtual -Person() { 

4 cout « “Deleting a person. w « endl; 


class Student : public Person { 
public: 

) -Student() { 

cout << ^Deleting a student. M 

> 

■ >； 

;int main() { 

Person * p * new Student(); 


编译执行上面的代码，打印输出 如下： 

Deleting a student. 

Deleting a person. 

4. 默认值 

如下所示，函数可以指定畎认值。注意，所有默认参数必须放在闲数声明的右边，因为没有 
其他途径来指定参数是怎么排列的 u 
1 int func(int a, int b = 3) { 


1 b ; 


b; 


func(4); 
func(4, 5); 
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5. 操作符重载 

有了操作符重载 （operator overloading X 原本不支持+等操作符的对象，就可以用上这些操 
作符。举个例子，要想把两个书架 （ Bookshelf ) 并作一个，我们可以这样重载 作符： 

1 Bookshelf Bookshelf::operator+(Bookshelf &other) { ... } 

6. 指针和引用 

指针存放有变量的地址，可直接作用于变量的所有操作，都对以作用在指针上，比如访问和 
修改变量。 

两个指针可以彼此相等，修改其中一个指针指向的值，另一个指针指向的值也会随之改变。 
实际上，这两个指针指向同一地址。 



5 cout « *qj // 打印 8 

注意，指针的大小随计算机的体系结构不同而 不同： A 32 位机器上为32位，在64位机器上为64 
位。请谨记这一点区别，面试官常常会要求求职者准确地 N 答，某个数据结构到底要占用多少空间。 
♦引用 

引用是既有对象的另一个名宇（别名），引用本身并不占用内存。 例如： 

1 int a - 5; 

2 int & b e a; 

3 b = 7; 

4 cout « a; // 打印 7 

在上面第 2 行代码中， b 是 a 的 引用； 修改 b , a 也随之改变。 

创建引用时，必须指定引用指向的内存位置。当然，也可以创建一个独立的引用，如下 所示： 

1 /• 分 K 内存 . 《存12 . 

2 • > 明《甸这玦内舟的 il 用 b •/ 

3 int & b = 12; 

跟指针不同，引用不能为空，也+能重新 賦值. 指向另一块内存。 

• 指针算术运算 

我们经常会看到开发人员对指针执行加法操作.示例 如下： 

1 int * p = new int[2]; 

2 p[0] = 0 ； 

3 p[l] = 1 ； 

4 p ++； 

5 cout « *p; // 榆出 1 

执行 p ++ 会跳过 sizeof ( int ) 个字节，因此上面的代码会输出1。如果 p 换作其他类型， p ++ 就 
会跳过一定数目（等于该数据结构的大小〉的字节。 

7. 模板 

模板是一种代码重用方式，不同的数据类型可以套用同一个类的代码。比如说，我们可能有 
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列表类的数据结构，希望可以放进不同类型的数据。下面的代码通过 ShiftedList 类实现这一需求。 


1 template <class T> 

2 class ShiftedList { 

3 T* array; 

4 int offset, size; 

5 public: 

6 ShiftedList(int sz) : offset(0), size(sz) { 

7 array = new T[size]; 

8 > 

9 

10 -ShiftedList() { 

11 delete [] array; 

12 > 

13 

14 void shiftBy(int n) { 

15 offset « (offset ♦ n) X size; 

16 > 

17 

18 T getAt(int i) { 

19 return array[convertIndex(i)]; 

20 > 

21 

22 void setAt(T item, int i)( 

23 array[convertlndex(i)] « item; 

24 > 

25 


26 private: 

27 int convertIndex(int i) { 

28 int index » (i - offset) X size; 

29 while (index < 0) index size; 

30 return index; 

31 > 


32 >； 


33 

34 Int raain() { 

35 int size = 4; 

36 ShiftedList<int> * list - new ShiftedList<int>(size); 

37 for (int i ■ 0; i < size; i++) { 

38 list->setAt(i > i); 

39 > 

40 cout << list->getAt(0) << endl; 

41 cout « list->getAt(l) << endl; 

42 list->shiftBy(l); 

43 cout << list->getAt(0) << endl; 

44 cout << list->getAt(l) << endl; 

45 delete list; 

46 } 


面试题目 


13.1 用 C ++ 写个方法，打印输人文件的最后妇？。（第274页） 
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13.2 比较并对比散列表和 STL map u 散列表是怎么实现的？如果输人的数据 tt 不大，可以选用 
哪些数据结构替代散列表？ （ 第275页） 

13.3 C++ 虚函数的工作原理是什么？（第275页） 

13.4 深拷贝和浅拷贝之间有何区别？请说明两者的用法。（第276页） 

13.5 C 语言的关键字 volatile 有何作用？（第277页） 

13.6 基类的析构函数为何要声明为 virtual? (第278页） 

13.7 编写方法，传人参数为指向 Node 结构的指针，返回传人数据结构的完整拷贝。其中， Node 
数据结构含有两个指向其他 Node 的指针。（第278页） 

13.8 编写一个智能指针类。智能指针是一种数据类型，一般用模板实现，模拟指针行为的同时 
还提供自动垃圾回收机制。它会自动记录 SnartPointer^ThS 象的弓 | 用计数，一旦 T 类型对 
象的引用计数为零，就会释放该对象。（第279页） 

13.9 编写支持对齐分配的 malloc 和 free 函数，分配内存时， malloc 函数返回的地址必须能被2 
的《次方整除。 

示例 

align_malloc(1000,128> 返回的内存地址吋被128幣除，并指向一块1000宇节大小的内存。 
aligned_free() 会释放 align_raalloc 分配的内存。 （ 第281 页） 

13.10 用 C 编写一个 my2DAlloc 闲数.可分配一.维数组。将 malloc 闲数的调用次数降到堪:少，并 
确保町通过 arr'tiHj] 访问该内存。（第282页） 


参考 问趙： 数组与字符串 (#1.2) ;链表 （#2.7) ;测试 （#12.1) ; Java (#14.4) ;线程与 
锁 （#16.3 ) 。 

8.14 Java 

虽然本书到处都是跟 Javaffi 关的问题，不过，本章探讨的是 Java 及其语法方面的问题。较大 
的公司通常不会考这类问题，这些公司偏 ® 丁测 试求职者的资质而非知识，也有时间和资源就特 
定语言对求职者进行培训。不过，若在其他公司，这类棘手的问题可能相当常见。 

1. 如何处理 

既然这些问题考的是你知道不知道，讨论这类问题的解法似乎冇点可笑。毕竞，所谓的解法 
不就是要知道正确答案吗？ 

既是也不是。当然，掌握这些问题的最佳途径就是搞懂 Java 的黾里 外外。不过，若在处理问 
题时卡壳了，不妨试试下面的方法。 

(1) 根据情况创建实例，问问自己该如何推演。 

(2) 问问自己，换作其他语言，该怎么处理这种情况。 

(3) 如果你是语言设计者，该怎么设计？各种设计选择都会造成什么影响？ 

相比不假思索地答出问题，如果你能推导出答案，同样会给面试官留下深刻的印象。不要 
试图蒙混过关。你可以直接告诉面 试官： “我不确定能否想起答案，不过让我试试能不能搞定 
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它。假设我们拿到这段代码……” 

• 关键字 final 

Java 语言的关键字 final 用于变量、类或方法时，含义各不相同。 

□ 变量： 一旦初始化，变量值就不能 修改。 

□方法：该方法不能被子类重写 （ ovenide )。 

□类： 该类不能派生子类。 

• 关键字 finally 

关键字 finally 和 try / catch 语句块配对使用，即使有异常抛出，也能确保某段代码一定会 
执行。 finally ^ 块会在 try 和 catch 语句块之后，在控制权交回之前执行。 

注意，下面这个例子中该关键字是怎么起作用的。 

1 public static String lem() { 

2 System.out.printIn("lem^); 

3 return ^return from lem^; 

4 } 

5 

6 public static String foo() { 

7 int x ■ 0; 

8 int y - 5; 

9 try { 

10 Systea.out.println( w start try~); 

11 int b ■ y / x; 

12 System.out.println( w end try**); 

13 return "returned froi* try"; 

14 } catch (Exception ex) { 

15 System.out.println( w catch w ); 

16 return lem() + n \ returned from catch w ; 

17 > finally { 

18 System, out. print ln( w f inally**); 

19 > 

20 > 

21 

22 public static void bar() { 

23 System. out. print In ( M start bar - *); 

24 String v * foo(); 

25 System.out.println(v); 

26 System. out. print In ( r< end bar^); 

27 } 

28 

29 public static void main(String[] args) { 

30 bar(); 

31 } 

这段代码的输出 如下： 

1 start bar 

2 start try 

3 catch 

4 lem 

5 finally 

6 return from lem | returned fro« catch 

7 end bar 
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注意上述输出的第 3 ~ 5 行。整个 catch 语句块都会执行（包括语句里的函数调用）， 
然后执行 finally 语句块，之后该函数才真正返回。 

• finalize 方法 

在真正销毁对象之前，自动垃圾收集器会调用 finalize () 方法。因此，一个类可以重写 
Object 类的 finalize () 方法，以便定义在垃圾收集时的特定行为。 

1 protected void finalize() throws Throwable { 

2 /* 关 « 己打开的文件，释放資源等*/ 

3 } 

2.重载与重写 

重载 （ overloading ) 是指两个方法的名称相同，但参数类型或个数不同。 

1 public double coiiputeArea(Circle c) { ... } 

2 public double conputeArea(Square s) { … } 

而重写 ( overriding ) 是指某个方法与父类的方法拥有相同的名称和闲数签名。 

1 public abstract class Shape { 

2 public void printMe() { 

3 System.out.println( ,r I am a shape.**); 

4 > 

5 public abstract double conputeArea(); 

6 > 

7 

8 public class Circle extends Shape { 

9 private double rad - 5; 

10 public void printMe() { 

11 System.out.println( n I am a circle.**); 

12 > 

13 

14 public double computeArea() { 

15 return rad * rad * 3.15; 

16 > 

17 > 

18 

19 public class Ambiguous extends Shape { 

20 private double area = 10; 

21 public double computeArea() { 

22 return area; 

23 > 

24 } 

25 

26 public class IntroductionOverriding { 

27 public static void _ain(String[] args) { 

28 Shape[] shapes = new Shape[2]; 

29 Circle circle = new Circle(); 

30 Ambiguous ambiguous = new Ambiguous(); 

31 

32 shapes[0] * circle; 

33 shapes[1] = ambiguous; 

34 


for (Shape s : shapes) 
s.printMe(); 


s.coMputeArea()); 


这段代码的输出 如下： 


由此可见， Circle 重写了 printMeO , 但 Ambiguous 并未重写该方法。 

3. 集合框架 

Java 的集合框架 （collection framework >极其有用，本书许多章节都用到了。下面介绍几个 
M 常用的。 

ArrayList ： ArrayList 是一种 h 了动态调整大小的数组，随着元素的插人，数组会适时扩容。 

1 ArrayList<StPing> myArr = new ArrayList<String>(); 

2 myArr.add(“one M >; 

3 myArr.add( w two w ); 

4 System.out .print In (myArr. get (0)); /• 打印 <one> •/ 

Vector ： Vector 与 ArrayList 非常类似，只不过前者是同步的 （ synchronized )。两者语法也 
相差无几。 

1 Vector<String> nyVect = new Vector<String>(); 

2 myVect.add( w one w ); 

3 myVect.add( w two w ); 

4 System.out.prlntln(myVect.get(0)); 

LinkedList ： 这里说的 LinkedList 当然是 Java 内诖的 LinkedList 类。 LinkedList 在面试中 
很少出现，不过值得学习研究，因为使用时会引出一些迭代器的语法。 

1 LinkedList<String> royLinkedList ■ new LinkedList<String>(); 

2 myLinkedList.add( M two M ); 

B myLinkedList.addFirst( w one M ); 

4 Iterator<String> iter * ■yLinkedList.iterator(); 

5 while (iter.hasNext(>) { 

6 System.out.printIn(iter.next()); 


HashMap ： HashMap 集合广泛用于各种场合，不论是在面试中，还是在实际开发中。下面展 
示了 HashMap 的部分语法 3 

1 HashMap<String, String 〉 map = new HashHap<String, String>(); 

2 map. put (“one”, ,r uno M ); 

3 map.put( f, two M , M dos M ); 

4 System.out.println(nap•get( OT one w )); 

面试之前，确保自己对上述语法了如指掌。这些语法派得上用场。 
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面试题目 


请注意，本书几乎所有问题的解决方法都采用 Java 实现，因此这里只列了几个问题。而且， 
这些问题主要涉及 Java 语言的细枝末节，毕竟本书其余章节中有很多 Java 有关的编程问题。 

14.1 从继承的角度来看，将构造函数声明为私有会有何作用？（第284页） 

14.2 在 Java 中，若在 try - catch - finally 的 try 语句块中插入 return 语句， finally 语句块是否 
还会执行？（第284页） 

14.3 final , finally 和 finalize 之间有何差异？（第285页 > 

14.4 0+模板; ftUava 泛型之间有何不同？ （第 285 页） 

14.5 Java 中的对象反射是什么？它有什么用？ （ 第287页） 

14.6 实现 CircularArray 类，支持类似数组的数据结构，这些数据结构可以高效地进行旋转。 
该类应该使用泛型，并通过标准的 for (Obj o : circularArray ) 语法支持迭代操作 u (第 
287 页) 


参考 问題： 数组与字符串 (#1.4) ；面向对象设计（抑 .10) ;线程与锁 （#16.3) 。 

8.15 数据库 

有数据库经验的求职者坷能会被要求实现 SQL 杏询，或是设计应用程序所笛的数据库.以确 
认你常握这方面的知识。本章将回顾一些关键槪念，并简述如何解决这些问题。 

看到这些査询时，对于语法上的细撖差异，不必太惊讶。 SQL 的版本和变体很多，下面这些 
SQL 与你之前接触过的可能稍冇不同 1 本书的 SQL 示例已在微软 SQL Server 较过测试。 

1. SQL 语法及各类变体 

开发人员常常会在 SQL 査询中使用隐式连接 （implicit join ) 和显式连接 （explicit join )。 两者 
的语法如下。 

1 /* 蓋式连搞 */ 



上面两条语句的作用是等价，至于选用哪条全看个人喜好。为保持前后一致，我们将一直使 
用显式连接。 

2. 非规范化和规范化数据库 

规范化数据库的设计目标是将冗余降到最低，而非规范化数据库则是为了优化读取时间。 
在传统的规范化数据库中，若有诸如 Courses 和 Teachers 的数据， CoursesSJ ■能含有 
TeacherlD 列，这是指向 Teachers 的外键 （foreign key )。这么做的好处之一是，关于教师的信息 
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(姓名、住址等）在数据库中只有一份。而缺点是大 M 常用的查询需要执行开销很大的连接操作。 

反之，我们可以存储冗余数据，使数据库非规范化。例如，若能预计到这类査询会频繁执行， 
可以将教师姓名存到 Courses 表中。非规范化通常用于构建髙可扩展性系统。 

3. SQL 语句 

下面以前面提到的数据库为例.复习一下基本的 SQL 语法。这个数据库的简单结构如下，其 
中*表示 主键： 

Courses : CourselD*, CourseName, TeacherlD 
Teachers: TeacherlD*, TeacherName 
Students: StudentID*, StudentName 
StudentCourses : CourselO*, StudentID* 

根据上面这些表，实现下列査询。 

• 查询1:学生选课情况 

实现一个査询，列出所有学生，以及每个学生选修了几门课程。 

首先，我们或许可以试着这么写： 

1 /* 错溪的代玛 V 

2 SELECT Students.StudentName > count(_) 

3 FROM Students INNER 30IN StudentCourses 

4 ON Students.StudentID ■ StudentCourses.StudentID 

5 GROUP BY Students.StudentIO 

上述査询有以下 s 个问埋。 

(1) 我们将一门课都没选 的学生 排除掉了，因为 StudentCourses 只包括已经选课的学牛。我 
们可以把 INNER : JOIN 改为 LEFT JOIN (左连接）。 

(2) 即使改为 LEFT 30 IN , 上面的査询还是不太对。 count (*> 会返回一组 StudentID 里有几项。 
一 N 课都没选的学生在对应的组里仍有一项。这里需要将 CO unt (*) 改为 i | •数每个组里 CourselD 
的数 tt : count (StudentCourses . CourselD )。 

(3) 上面的査询已按 Students . StudentID 分组，但每个组仍有多个 StudentName 。 数据库怎 
么知道该返回哪个 StudentName ? 当然，它们的值可能都一样，但数据库并不知道这点。这里需 
要运用聚合 （aggregate ) pfi 数，比如 first ( Students . StudentName )。 

修正上述问題后，得到如下 査询： 

1 /* 解法1:用另一个金询包裏起来 V 

2 SELECT StudentName, Students.StudentID, Cnt 

3 FROM ( 

4 SELECT Students.StudentID, 

5 count(StudentCourses.CourselD) as [Cnt] 

6 FROM Students LEFT JOIN StudentCourses 

7 ON Students.StudentID = StudentCourses.StudentID 



看到这段代码，有人可能会问，为什么不直接在第3行里选出学生姓名，就不需要第3到第6 
行的另一个査询了。这么做的话，就会得到如下（错误的） 解法： 






/* 错误的代玛 

SELECT StudentName, Students.StudentID, 

count(StudentCourses.CourselD) as [Cnt] 
FROM Students LEFT 30IN StudentCourses 
ON Students.StudentID = StudentCourses.StudentlD 
GROUP BY Students.StudentlD 


答案是我们不能这么改——至少不能一五一十照上面月 
GROUP BY 子句里的值。 

另外，我们可以使用下面两条语句之一解决上面的 问题: 

1 /* 解法2 : 在 GROUP BY 子句中加入 StudentName V 

2 SELECT StudentName, Students.StudentlD, 

3 count(StudentCourses.CourselD) as [Cnt] 

4 FROM Students LEFT DOIN StudentCourses 

5 ON Students.StudentID » StudentCourses.StudentlD 

6 GROUP BY Students.StudentID, Students.StudentName 


至少不能一五一十照上面那样改。我们只能选择聚合函数或 


1 /* 解法 3: 用聚合办數包 褎 起来 •/ 

2 SELECT max(StudentName) as [StudentName], Students.StudentlD, 

3 count(StudentCourses.CourselD) as [Count] 

4 FROM Students LEFT DOIN StudentCourses 

5 ON Students.StudentID - StudentCourses.StudentlD 

6 GROUP BY Students.StudentID 

• 查询 2: 教师班级规模 

实现一个査询，取得一份所有教师的列表，以及每位教师要教多少学生。如果一位教师给某 
个学生教授两门课程，那么，这个学牛.就要计人两次。根据教师教授的学牛人数，将结果列表从 
大到小进行排序。 

下面逐步构造这个査询。 t 先，取得一份 TeacherlD 列表，以及有多少学生跟各个 TeacherlD 
有关联。这跟前一个査询非常相似。 

1 SELECT TeacherlD, count(StudentCourses.CourselD) AS [Number] 

2 FROM Courses INNER DOIN StudentCourses 


请注意，这里的 INMER JOIN 不会选取那些不教课的教师，我们会在下面的查询中进行处理， 
将它与包含所有教师的列表相连接。 
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4. 小型数据库设计 

另外，面试官或许会让你自己设计一个数据库。下面会逐步剖析一种设计方法。你可能会发 
现该方法与面向对象设计方法存在相似之处。 

• 步骤1:处理不明确的地方 

不管是有意还是无意，数据库问題往往存在含糊不清的地方。开始设计之前，你必须准确理 
解自己要设计什么。 

设想一下，你被要求设计一套系统，供公寓租赁中介使用。你需要弄清楚这家中介有多栋 
楼还是只有一栋，而且还应该跟面试官讨论系统的通用性要做到什么程度。比如，某人租用同 
一栋楼里的两套公寓的情况极为少见，但这是否意味着你用不着处理这种情况？也许是，也许 
不是。有些非常罕见的条件或许最好做变通处理（比如，在数据库中，重复存储承租人的联系 
信息)。 

• 步骤2:定义核心对象 

接下来，该来看看系统的核心对象 r 。 一般来说，每个核心对象都会转变为一张表。在这个 
例子中，核心对象可能包括 Property (财产 ）、 Building (大楼 ）、 Apartment (公寓 ）、 Tenant 
( 承租人）和 Manager ( 管理员）。 

• 步 *3: 分析表之间的关系 

勾勒出核心对象后，我们就可以比较淸晰地知道这些表该是什么样的。这些表之间有何关联 
呢？它们的关系是多对多？还是一对多？ 

若 Building 和 Apartment 有一对多的关系（- - ftBuilding 会有很多 Apartment )，那么，也 
许可以表示 如下： 



注意， Apartments 表通过 BuildingID 列链接冋 Buildings 。 

若允许承 租人租 用多套公寓，那么，可能就要实现多对多关系，如下 所示: 
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TenantApartments 表储存 Tenants 和 Apartments 之间的关系。 

• 步骤4:研究该有什么操作动作 

最后. 我们要填充细节。想想常见的操作动作，弄清楚如何存人和取回相关数据。我们还需 
处理租赁条款、腾空房间、租金付款等。每个动作都需要新的表和列。 

5. 大型数据库设计 

在设计大型、可扩展的数据库时，上述例子用到的连接 （ join ) 通常都很慢。因此，你必须 
对数据做非规范化处理。请仔细想想数据会怎么使用 一 你坷能需要在多个表中重复储存同一份 


面试题目 


问题 I ~ 3用到以下数据库 模式: 




IZ£SS31HHi 



8MHH 




















| Complexes 


1 AptTenants 


1 Requests 


















E5S3IBHBI 









注意每套公寓可能有多位承租人，而每位承租人可能租住多套公寓。每套公寓只属于一栋大 
楼.时每栋大楼属于一个综合体。 

15.1 编写 SQL 査询，列出租住不止一套公寓的承租人。（第290贞） 

15.2 编写 SQL 査询，列出所有建筑物，并取得状态为 “ Open ” 的申请数量（ Requests 表中 Status 
为 Open 的条目）。（第291页） 

15.3 II 号建筑物正在进行大翻修编写 SQL 査询，关闭这栋建筑物里所有公寓的人住申请。（第 
291 页) 

15.4 连接有哪些不同类型？请说明这些类型之间的差异，以及为何在某些情形下，某种连接会 
比较好。（第291页） 

15.5 什么是反规范化？请说明优缺点。（第292页） 

15.6 有个数据库，里面有公司 （ companies )、 人 （ people ) 和专业人员 （ professionals , 为 
公司工作)，请绘制实体关系图。（第293页） 

15.7 给定一个储存有学生成绩的简申数据库。设计这个数据库的大概样子，并编写 SQL 查询， 
返回优等生名单 （ 排名前10% )，以平均分排序。 （ 第293页） 


参考 问题： 面向对象设计 （#8.6 ) 
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8.16 线程与锁 

在微软、谷歌或亚马逊等公司的面试中，求职者被要求以线程实现算法的情况并不是很常见 
(除非你打算加人的团队特别看重这方面的技能)。不过，不管是什么公司，面试官常常会考你对 
线程有没有一定程度的了解，特别是对死锁的理解。 

本章将简要介绍这个 主理。 

1 . Java 线程 

在 Java 中，每个线程的创建和控制都是由 java . lang.Thread 类的独特对象实现的。一个独立 
的应用运行时.会自动创建一个用户线程，执行 main () 方法。这个线程叫作主线程。 

在 Java 中，实现线程有以下两种 方式： 

□ 通过实现 java . lang . Runnable 接口； 

□ 通过扩展； Java . lang.Thread 类。 

下面介绍这两种方式。 

• 实现 Runnable 接口 
Runnable 接口的结构非常 简单： 

1 public interface Runnable { 

2 void run(); 

3 > 

要用这个接口创建和使用线程，步骤如下。 

(1) 创建一个实现 Runnable 接 U 的类，该类的对象是一个 Runnable 对象。 

⑵创建一个 Thread 类甩的对象.并将 Runnable 对象作为参数传人 Thread 构造函数。于是， 
这个 Thread 对象包含一个实现 run () 方法的 Runnable 对象。 

(3) 调用上一步创建的 Thread 对象的 start () 方法 D 
示例如下： 

1 public class RunnableThreadExanple implements Runnable { 

2 public int count ■ 0 ; 


public void run() { 
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18 public static void iaain(String[] args) { 

19 RunnableThreadExample instance » new RunnableThreadExample(); 

20 Thread thread ■ new Thread(instance); 

21 thread.start(); 

22 

23 /* 等到上面的线桎数到 5 (时 间有点长） */ 

24 while (instance.count !- 5) { 

25 try { 

26 Thread.sleep(250); 

27 } catch (InterruptedException exc) { 

28 exc.printStackTrace(); 

29 > 

30 > 

31 > 

从上面的代码可以看出，我们真正需要做的是我们的类必须实现 run () 方法（第4行)。然后， 
另一个方法就可以将这个类的实例传人 new Thread ( obj ) (第 19 〜 20行\然后调用那个线程的 
start () (第21 行)。 

• 扩展 Thread 类 

创建线程还有一种方式，就是通过扩展 Thread 类实现。使用这种方式，基木上就意味着要重 
写 run () 方法，并且在子类的构造函数里，还需要昆式调用这个线程的构造函数。 

下面是使用这种方式的示例代码。 
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> 


这段代码跟之前的做法非常相似 c 两者的区别在于，既然我们是扩展 Thread 类而非只是实现 
—个接口，因此可以在这个类的实例中调用 startO 。 

參扩展 Thread 类 vs . 实现 Runnable 接口 

在创建线程时，相比扩展 Thread 类，实现 Runnable 接口可能更优，理由有二。 

□ Java 不支持多重继承。因此，扩展 Thread 类也就代表这个子类不能扩展其他类。而实现 
Runnable 接口的类还能扩展另一个类。 

□ 类可能只要求可执行即可，因此，继承整个 Thread 类的开销过大。 

2. 同步和锁 

给定一个进程内的所有线程，都共李同一存储空间，这样有好处又有坏处。这些线程就可以 
共享数据，非常有用。不过，在两个线程同时修改某一资源时，这也会造成一些问题。 Java 提供 
了同步机制，以控制对共享资源的访问。 

关键字 synchronized 和 lock 构成了代 W 同步执行的实现基础。 

• 同步方法 

最常见的做法是，使用关键字 synchronized 对共享资源的访问加以限制。该关键字可以用 
在方法和代码块 h . 限制多个线程.使之不能同时执行同一个对象的代码。 

要搞淸楚最后一点，请看以下代 




若有两个 MyClass 实例，能否同时调用 foo? 这要看情况，若它们共用一个 MyObject 实例， 
则答案是不可以。但是，若两个实例持有不同的引用，那么，答案就是可以。 

1 /• 不同的 il 用——《个线《_親《用 MyOb：)ect.foo<) V 

2 MyObject objl = new MyObjectO; 

3 MyObject obj2 ■ new MyObject(); 

4 MyClass threadl * new MyClass(objl, "1"); 

5 MyClass thread2 ■ new HyClass(obj2, "2 U ); 

6 threadl.start(); 

7 thread2.start () 

8 

9 /* 相同的 obj?| 用.只有一个线 CT 以调用 foo, 另一个钱《必 蜎等碕 •/ 

11 MyObject obj - new MyObject(); 

12 MyClass threadl * new HyClass(obj, "l u ); 

IB MyClass thread2 ■ new MyClass(obj, n 2 M ); 

14 threadl.start() 

15 thread2.start() 

静态方法会以类锁 （class lock ) 进行同步。上面两个线程无法同时执行同一个类的同步 
静态方法， B 卩使其中一个线程调用 foo 而另一个线程调用 bar 也不行。 



public void run() { 

if (name.equals( M l M )) MyObject.foo(name); 
else if (name.equals( ,, 2 M )) MyObject. bar (name); 


public class MyObject { 

public static synchronized void foo(String name) 
/• 用之前的 foo 实现 */ 



Thread l.foo() : starting 
Thread l.foo() : ending 
Thread 2.bar(): starting 
Thread 2.bar() : ending 

• 同步块 

同样，代码块也可以同步化。其操作与同步方法非常相似。 
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7 public class MyObject { 

8 public void foo(String name) { 

9 synchronized(this) { 


和同步方法一样，每个 MyObject 实例只有一个线程可以执行同步块中的代码。这就意味 
着，若 threadl 和 thread 2 持有同一个 MyObject 实例，那么，每次只有一个线程允许执行那个 
代码块。 

參锁 

若要实现更细粒度的控制，我们可以使用锁 （ lock )。 锁（或监视器）用于对共亨资源的 
同步访问，方法是将锁与共享资源关联在一起。线程必须先取得与资源关联的锁，才能访问 
共享资源。不管在任意时间点，最多只有一个线程能拿到锁，因此，只有一个线程可以访问 
共享资源。 

锁的常见用法是，从多个地方访问同一资源时，同一时刻只有一个线程才能访问。以下面的 
代码为示范。 


public class LockedATM { 
private Lock lock; 
private int balance ■ 166 ; 


public LockedATM() { 



public int withdraw(int value) { 
lock.lock(); 
int temp ■ balance; 
try { 

Thread.sleep(100); 
temp - temp • value; 

Thread.sleep(100); 
balance - tenp; 

> catch (InterruptedException e) { 

lock.unlock<); 

return temp; 


public int deposit(int value) { 
lock.lock(); 
int temp * balance; 
try { 

Thread.sleep(100); 
temp = tenp + value; 

Thread.sleep(306); 
balance = teaip; 

} catch (InterruptedException e) { 
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31 lock.unlock(); 

32 return temp; 

33 } 

34 } 

当然，上述代码做了特别处理，有意降低了 withdraw (提款）和 d 印 osit (存款）的执行速 
度，以便演示可能会出现的问题。在实际开发中，我们不必写这种代码，但它反映的情况却非常 
真实。使用锁有助于保护共享资源，使其免遭篡改。 

3. 死锁及死锁的预防 

死锁 （deadlock) 是这样一种 情形： 第一个线程在等待第二个线程持有的某个对象锁，而第 
二个线程又在等待第一个线程持有的对象锁（或是由两个以上线程形成的类似情形)。由于每个 
线程都在等其他线程释放锁，以致每个线程都会一直这么等下去。于是，这些线程就陷人了所谓 
的死锁。 

死锁的出现必须同时满足以下四个条件。 

(1> 互斥： 某一时刻只有一个进程能访问某一资源。（或者， 史准确 地说，对某一资源的访问 
有限制。若资源数 M 冇限，也可能出现死锁。） 

(2) 持有并 等待： 已持有某一资源的进程不必释放当前拥有的资源，就能要求更多的资源。 

(3) 没有 抢占： 一个进程不能强制另一个进稈释放资源。 

(4> 循环 等待： 两个或两个以上的进程形成循环链，每个进程都在等待循环链中另一进程持 
有的资源。 

若要预防死锁，只需避免上述任一条件， m 这很棘手，因为其中有些条件很难满足。比如， 
想要避免条件I就很闲难，因为许多资源同一时刻只能被一个进程使用（如打印机)。大部分预防 
死锁的算法都把1：心放在避免条件4即循环等待上。 


面试題目 _ 

16.1 线程和进程冇何区別？（第296贞> 

16.2 如何测 M 上下文切换时间？ f 第296 页） 

16.3 在著名的哲学家就餐问题中，一群哲学家围坐在岡燊周围.每两位哲学家之间有一根筷子。 
每位赶学家需要两根筷子才能用餐，并且一定会先拿起左手边的筷子，然后才会去拿右手 
边的筷子。如果所有哲学家在同一时间拿起左手边的筷子，就有可能造成死锁。请使用线 
程和锁，编写代码模拟哲学家就餐问题，避免出现死锁。（第298页） 

16.4 设计一个类，只有在不可能发生死锁的情况下，才会提供锁。（第299页） 

16.5 给定以下 代码： 

public class Foo { 
public Foo() { ... } 
public void first() { ... } 
public void second() { … } 
public void third() { ... } 
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同一个 Foo 实例会被传入3个不同的线程。 threadA 会调用 first , threadB 会调用 second , 
threadC 会调用 third 。 设计一种机制，确保 first 会在 second 之前调用， second 会在 third 
之前调用。 （ 第304页） 

16.6 给定一个类，内含同步方法 A 和普通方法 B 。 在同一个程序实例中.有两个线程.能否同时 
执行 A ? 两者能否同时执行 A 和 B ?( 第305页） 


8.17 中等难题 

17.1 编写一个函数，不用临时变量，直接交换两个数。（第306页） 

17.2 设计一个箅法，判断玩家是否贏了井宇 游戏。 （第307页） 

17.3 设计一个算法，算出 n 阶乘有多少个尾随零.（第310页） 

17.4 编写一个方法，找出两个数宇中最大的那一个。 + 得使用 if ^ else 或其他比较运算符。 

(第311页） 

17.5 珠巩妙算游戏 （The Game of Master Mind ) 的玩法如下。 

计箅机有四个槽.每个槽放一个球，颜色可能是红色 （ R )、 黄色 （ Y )、 绿色 （ G ) 或蓝 
色 （ B )。 例如，计算机可能有 RGGB 四种（槽1为红色.梢2、3为绿色.梢4为蓝色)。 

作为用户，你试阁猜 出顔色 组合。打个比方，你可能会猜 YRGB 。 

要是猜对某个槽的颜色，则算一次“猜 中”； 要是只猜对颜色但槽位猜错了，则算一次“伪 
猜中”。注意，“猜中”不能算入“伪猜中”。 

举个例子.实际颜色组合为 RGBY , 而你猜的是 GGRR , 则算一次猜中.一次伪猜中。 

给定一个猜测和一种颜色组合，编写一个方法，返回猜中和伪猜中的次数。（第313页） 
17.6 给定-个整数数组，编写一个函数，找出索引《和1只要将》1和《之间的元素排好序，整个 
数组就是有序的。 注意： 越小越好.也就是说，找出符合条件的最短序列。 

示例： 

输人：1, 2, 4, 7, 10, 11, 7, 12, 6, 7, 16, 18, 19 
输出： <3, 9〉（第314页） 

17.7 给定一个整数，打印该整数的英文描述（例如 “One Thousand , Two Hundred Thirty Four ” )。 
(第 316 页） 

17.8 给定一个整数数组（有正数有负数），找出总和最大的连续数列，并返冋总和。 

示例： 

输入： 2, -8, 3, -2, 4, -10 
输出： 5( 即 {3, -2, 4}) (第318页） 

17.9 设计一个方法，找出任意指定单词在一本书中的出现频率。（第319页） 

17.10 XML 非常冗长，你找到一种编码方式，可将每个标签对应为预先定义好的整数值，该编 
码方式的语法 如下： 
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Element --> Tag Attributes END Children END 
Attribute ••> Tag Value 

END --> 0 

Tag --> 映射至某个預定义的整致值 

Value — > 字符串值 END 

例如，下列 XML 会被转换压缩成下面的字符串 （ 假定对应关系为 family 1 、 person -> 

2、 firstName -> 3、 lastName -> 4、 state -> 5)。 

<fa«ily lastNa«e- w HcDowell M state- w CA M > 

<person firstName= M Gayle M >So«ie Message</person> 

</family> 

变为： 


14 McDowell 5 CA 0 2 3 Gayle 0 Some Message 0 0. 

编写代码.打印 XML 元素编 R 后的版本（传人 Element 和 AttributeXj 象)。（第320页） 
17.11 给定 randS (), 实现一个方法 rand 7(〉。 也即，给定一个产生0到4 ( 含）随机数的方法， 
编写一个产生0到6 ( 含） 随机数的方法。（第321 页〉 

17.12 设计一个算法，找出数组中两数之和为报定值的所有整数对。（第323页） 

17.13 有个简单的类似结点的数据结构 BlNode , 包含两个指向其他结点的 指针： 

1 public class BiNode { 

2 public BiNode nodel, node2; 

3 public int data; 

4 > 

数据结构 BiNode 可用来表示二叉树（其中 nodel 为左子结点， node 2 为右子结点）或双向 
链表 ( 其中 nodel 为前趋结点， node 2 为后继结点 ） 。编写一个方法，将二叉査找树(用 BiNode 
实现）转换为双向链表。要求所有数值的排序不变，转换操作不得引人其他数据结构（即 
直接操作原先的数据结构 ）（ 第324页） 

17.14 哦，不！你刚刚写好一篇长文.却倒霉地误用丫 “査找/替换”.不慎删除了$档中所有空 
格、标点，大写变成小写。比如，句子 •‘！ reset the computer. It still didn’t boot!" ( 我重启 
了电脑，但还没启动好！）变成 7* "iresetthecomputeritstilldidntboot" 0 你发现，只要能正确 
分离各个申-闻，加标点和调整大小写都+成问题。大部分单词在字典里都找得到，有些字 
符串如专冇名词则找不到。 

给定一个宇典（一组单词)，设计一个算法，找出拆分一连串单词的最佳方式。这里"最 
佳”的定义是，解析后无法辨识的字符序列越少越好。 

举个例子，字符串 "jesslookediustliketimherbrother" 的最佳解析结果为 "JESS looked just like 
TIM her brother", 总共有 7 个字符无法辨别，全部显示为大写，以示区别。（第327页） 

8.18 高难度题 

18.1 编写一个函数，将两个数字相加。不得使用+或其他算术运算符。（第331页） 
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18.2 编写 ■■个 方法，洗一副牌。要求做到完美洗牌，换言之，这副牌52!种排列组合出现的概率 
相同。假设给定一个完美的随机数发生器。（第332页） 

18.3 编写一个方法，从大小为《的数组中随机选出 m 个整数。要求每个元素被选中的概率相同。 

( 第333页） 

18.4 编写一个方法，数出0 到； 》( 含）中数字2出现了几次。 

示例： 

输人： 2 S 

输出： 9 ( 2, 12, 20, 21, 22, 23, 24和25。注意22有两个2。 ）（ 第334页） 

18.5 有个内含单词的超大文本文件，给定任意两个单闻，找出在这个文件中这两个单间的最短 
距离 （ 也即相隔几个单词）。有办法在 0(1) 时间里完成搜索操作叫？解法的空间复杂度如 
何？（第33?页） 

18.6 设计一个算法，给定10亿个数字，找出最小的100万个数字。假定计算机内存足以容纳全部 
1 Of 乙个数字。（第338页） 

18.7 给定一组单词，编写一个程序，找出其中的最长单词，且该单词由这组单词中的其他单词 
组合而成。 

示例： 

输人： cat , banana , dog , nana , walk , walker , dogwalker 
输 Mi : dogwalker ( 第 33 9 页） 

18.8 给定一个字符串 s 和一个包含较短字符串的数组 T , 设计一个方法，根据 T 中的每一个较短字 
符串，对 s 进行搜索。（第341页） 

18.9 随机生成一些数字并传人某个方法。编写一个程序.每当收到新数字时，找出并记录中位 
数。（第342页） 

18.10 给定两个字典里的单同，长度相等。编写一个方法，将一个单词变换成另一个单词 ，一 
次只改动一个字母。在变换过程中，毎一步得到的新单同都必须是字典里存在的。 

示例： 

输人： DAMP , LIKE 

输出 ： DAMP -> LAMP -> LIMP -> LIME -> LIKE (第 343 页） 

18.11 给定一个方阵，其中每个单元（像素）非黑即白。设计一个算法，找出四条边皆为黑色 
像素的最大子方阵。 （ 第345页） 

18.12 给定一个正整数和负整数组成的阵，编写代码找出元素总和最大的子矩阵。（第 
348页) 

18.13 给定一份几百万个单词的清单，设计一个算法，创建由字母组成的最大矩形，其中每一 
行组成一个单词 （ 自左向右），每一列也组成一个单词 （ 自上而下）。不要求这些单同在 
清单里连续出现，但要求所有行等长，所有列等高。（第352页） 
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9.1 数组与字符串 

1.1 实 现一个 算法.确 定一个 字符串的所有字符是否全都不同。假使不允许使用额外的数 
据结构.又该如何处理？（第46页） 

解法 

—开始，不妨先问问面试官，上面的字符串是 ASCII 字符串还是 Unicode 宇符串。这很重要， 
问这个问题表明你关注细节，并且对计算机科学有深刻了解„ 

为了简单起见，这里假定字符集为 ASCII 。 若不是的话，则需扩大存储空间，不过其余逻辑 
没有分别。 

假定字符集为 ASCII , 对于这个问题，我们可以做一个简单的优化，若字符串的长度大于宇 
母表中的字符个数，则直接返回 false 。 毕竞，若字母表只冇256个字符，字符串里就不可能有280 
个各不相同的字符。 

第一种解法是构建一个布尔值的数组,索引值 i 对应的标记指示该字符串是否含有字母表第 i 
个宇符。若这个宇符笫二次出现，则立即返回 false 。 

下面是这个算法的实现代码 „ 

1 public boolean isUniqueChars2(String str) { 

2 if (str.length() > 256) return false; 

3 

4 boolean[] char_set * new boolean[256]; 

5 for (int i » 0; i < str.length(); i-f-f) { 

6 int val ■ str.charAt(l); 

7 if (char_set[val]) { // 这个 字符已在字符♦中出现过 

8 return false; 

9 > 

10 char set[val] » true; 

11 ) 

12 return true; 


这段代码的时间复杂度为 0(«), 其中/»为字符串长度。空间复杂度为0(1)。 

使用位向量 （bit vector ), 可以将空间占用减少为原先的1/8。下面的代码假定字符串只含有 
小写字母 3 到 2 。这样一来.我们只需使用一个 int 型变 

1 public boolean isUniqueChars(String str) { 

2 if (str.length() > 26 ) return false; 

3 

4 int checker = 0; 

5 for (int i = 0; i < str.length(); i++) { 

6 int val = str.charAt(i) - *a J ; 

7 if ((checker & (1 << val)) > 0) { 

8 return false; 

9 > 

val); 
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12 return true; 

13 } 

另外，还有以下两种解法。 

(1) 将字符串中的每一个字符与其余字符进行比这种方法的时间复杂度为 OC / I 2 ), 空间复 
杂度为0(1)。 

(2) 若允许修改输人字符串，可以在时间里对字符串排序，然后线性检査其中有无 
相邻字符完全相同的情况。不过，值得注意的是，很多排序算法会占用额外的空间。 

从某些方面来看.这些算法算不 h 最优.不过.从 H 题的限制条件来看，或许还算是不错的 

解法。 


1.2 用 C 或 C ++ 实现 void reverse ( char * str ) 函数，即反转一个 null 结尾的字符串。 
(第46页） 


解法 

这是很经典的面试題，你可能会忽略 的是： 不分配额外空间，直接就地反转字符申，另外, 
还要注意 null 字符。 

下面用 C 语言实现整个算法。 

1 void reverse(char *str) { 

2 char* end ■ str; 

3 char trap; 

4 if (str) { 

while (*end) { /* 找出字符 ♦ 末見 •/ 


--end; /• 田逷一个字符，最后一个为 null 字符 •/ 

/* 从字符串賁見开始交糗两个字符 ，V 
* X 至两个指针在中间歧头 */ 
while (str < end) { 
tmp ■ *str; 

*str-f+ ■ *end; 

•end-- - tmp; 


上面的代码只是实现这个解法的诸多方法之一。我们甚至还可以递归实现这段代码，但并不 
推荐这么做。 

1.3 给定两个字符串，请编写程序，确定其中_个字符串的字符重新排列后，能否变成另 
一个字 符串。（第46页） 



解法 

跟其他许多问题一样，首先我们应该向面试官确认一些细节，弄清楚变位词 （anagram ) ①比 


①变位 is ! 是由变換某个词或短语的字母願序而构成的新的 is ! 或短语.一•译者注 
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较是否区分大小写。比如， God 是否为 dog 的变位词？此外，我们还应该问清楚是否要考虑空白 
字符。 

这里假定变位词比较区分大小写，空白也要考虑在内。也就是说 ， “god ”不是 “ dog ” 的 
变位词。 

比较两个字符串时，只要两者长度不同，就不可能是变位词。 

解决这个问题有两个简单的解决方法，并且都采用了上述优化，即先比较字符串长度。 

解法1:排序字符串 

若两个字符串互为 变位识 1,那么它们拥有同一组字符，只不过顺序不同。因此.对字符串排 
序，组成这两个变位词的字符就会有相同的顺序。我们只需比较排序后的字符串。 

1 public String sort(String s) { 

2 char [】 content ■ s.toCharArray(); 

3 java.util.Arrays.sort(content); 

4 return new String(content); 


7 public boolean permutation(String s. String t) { 

8 if (s.length() !- t.length(>) { 

9 return false; 

10 > 

11 return sort(s).equals(sort(t)); 

12 > 

在某种程度上，这个算法算不上最优，不过换个角度宥，该算法或许更 可取： 它清晰、简单 
且易懂。从实践角度来看，这可能是解决该问题的上佳之选。 

不过，要是效率当头，我们可以换种做法。 


解法2:检查两个字符串的各宇符数是否相同 

我们还可以充分利用变位词的定义一组成两个单同的字符数相同一来实现这个算法。我 
们只需遍历字母表，计算每个字符出现的次数。然后.比较这两个数组即可。 


public boolean permutation(String s. String t) { 
if (s.length() !- t.length()) { 
return false; 


int[] letters = new int[256]; // 钗设条件 
char[] s_array * s.toCharArrayO; 

for (char c : s^array) { // 计算字符争 s 中 | 个字符出现的 $ 数 
letters[c]++; 


for (int i = 0 ; i < t.length(); i-M-) { 
int c « (int) t.charAt(i); 
if (--letters[c] < 0 ) { 
return false; 
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return true; 


注意第 6 行的假设条件。在面试中，最好跟面试官核实一下字符集的大小。这里假设字符集 
为 ASCII 。 


1.4 编 写一个 方法.将字符串中的空格全部替换为“％20”。假定该字符串尾部有足够的 
空间存放新增字符.并且知道字符串的"真 实” 长度。 （注： 用 Java 实现的话，请使用字符数组 
实现，以便直接在数组上操作。 ）（ 第46页） 

解法 

处理字符串操作问题时，常见做法是从字符串尾部开始编辑，从后往前反向操作。这种做法 
很有用， W 为字符串尾部有额外的缓冲，可以直接修改，不必担心会覆写原存 数据。 

我们将采用上面这种做法。该算法会进行两次扫描。第一次扫描先数出宇符串中有多少空格， 
从而算出最终的字符申有多长。第二次扫描才真正开始反向编辑字符申。检测到空格则将 X 20 g 
制到下—个位置，若不是空白，就复制原先的宇符。 

下面是这个算法的实现代 R 。 

1 public void replaceSpaces(char[] str, int length) { 
int spaceCount ■ 0, newLength, i; 
for (1 s 0 ; i < length; { 
if (str[i] 
spaceCount 

> 

> 

newLength « length ♦ spaceCount • 2; 
str[newLength] * *\0 ’； 
for (i = length - 1; i >■ 0; i--) { 
if (str[i] - { 

str[newLength - 1] = r 0"; 
str[neMLength - 2] * ’2’； 
strfnewLength - 3] » 
newLength = newLength - 3; 

} else { 

str[newLength - 1] ■ str 【 i]; 
newLength = newLength - 1; 


因为 Java 字符串是不町变的 （ immutable ), 所以我们选用了字符数组来解决这个问题。若直 
接使用字符串，返回时就要把字符串复制一份，不过，这么做的好处是只需扫描一次。 
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1.5 利用字符重复出现的次数，编 写一个 方法.实现基本的字符串压缩功能。比如，字符 
串 aabcccccaaa 会变为 a 2 blcSa 3。 若“压缩”后的字符串没有变短，则返回原先的字符串。（第 
46页） 

解法 

乍一看，编写这个方法似乎相当简单，实则有点复杂。我们会迭代访问字符串，将字符拷贝 
至新字符串，并数出重复字符。这能有多难呢？ 

1 public String coopressBad(String str) { 

2 String mystr ■ 

3 char last a str.charAt(0); 

4 int count - 1; 

5 for (int i - 1; i < str.length(); i++) { 

6 if (str.charAt(i) ― last) { // 找重 1 字符 

7 count-M-; 

8 > else { // 穩入字 符的数 B, 史新 last 字符 

9 mystr last ♦⑽* count; 

10 last - str.charAt(i); 

11 count ■ 1 ; 

12 > 

13 ) 

14 return nystr + last + count; 

15 } 

这段代码并未处理压缩后字符串比原始字符串长的情况，但除此之外，全都满足要求。这种 
做法效率够高吗？不妨分析一下这段代码的执行时间。 

这段代码的执行时间为 + 其中 p 为原始字符串长度， * 为字符序列的数歌。比如.若 

字符串为 aabccdeeaa , 则总计有 6 个字符序列。执行速度慢的原 W 是字符串拼接操作的时间复杂 
度为 0(« 2 ) ( 参见 8.1 节的 StringBuffer 部分 
我们可以使用 StringBuffer 优化部分性能。 

1 String compressBetter(String str) { 

2 /* 检查压后的字符♦是否会变得史长 */ 

3 int size - countConpression(str); 

4 if (size >* str.length()) { 

5 return str; 

6 > 

7 

8 StringBuffer jnystr = new StringBuffer(); 

9 char last = str.charAt(0); 

10 int count * 1 ; 

11 for (int i ■ 1 ; i < str.length(); i<~f) { 

12 if (str.charAt(i) « last) { // 找釣重复字符 

13 count+♦; 

14 > else { // 插入字苻的数目，史新 last 字符 

15 mystr.append(last); // 插人字符 

16 my str. append (count); // 播入数目 

17 last = str.charAt(i); 

18 count = 1 ; 

19 > 
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20 } 

21 

22 /* 在上面第 15 到 16 行，当重复字符改变时， 

23 * 才会插入字符。我们还需在兩數末足史新 

24 * 字符串.因为最后一组重复字符还未放入 

25 * 压縮字符串中 • 

26 •/ 

27 mystr.append(last) ; 

28 mystr.append(count); 

29 return mystr.toString(); 

30 > 

32 int countConpresslon(String str) { 

33 if (str ■■ null I 丨 str.isEmpty()) return 0; 

34 char last * str.charAt(0); 

35 int size * 0; 

36 int count ■ 1; 

37 for (int i - 1; i < str.length(); i++) { 

38 if (str.charAt(i) -* last) { 

39 counts; 

40 > else { 

41 last ■ str.charAt(i); 

42 size +■ 1 + String.valueOf(count).length(); 

43 count ■ 1; 

44 > 

45 > 

46 size +■ 1 ♦ String.valueOf (count).length(); 

47 return size; 

48 } 

这个算法要好得多。注意，我们在第2 ~ 5行代码中加人了长度检査。 

若不想或不能使用 StringBuffer , 我们还是可以高效地解决这个问题。第2行代码会算出字 
符串压缩后的长度，这样就可以构建出相应大小的宇符数组，代码实现 如下： 

1 String compressAlternate(String str) { 

2 /• 检壹压 《后 的字符♦是否会 t 得史长 ♦/ 

3 int size ■ countCoaipression(str); 

4 if (size >■ str.length()) { 

5 return str; 

6 > 

7 

8 char[] array = new char[size]; 

9 int index » e ； 

10 char last > str.charAt(0); 

11 int count = 1 ; 

12 for (int i « 1 ; i < str.length(); i++) { 

13 if (str.charAt(i) == last) { // 找列重复字符 

14 count4-f ； 

15 } else { 

16 /* 史新重复字符的数目 V 

17 index = setChar(array« last, index, count); 

18 last = str.charAt(i); 

19 count » 1; 
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20 > 

21 > 

22 

23 /* 以最后一组重复字符史新字符争 */ 

24 index = setChar(array, last, index, count); 

25 return String.valueOf(array); 

26 > 

27 

28 int setChar(char[] array, char c, int index, int count) { 

29 array[index] = c; 

30 index-M-; 

B1 

32 /* 将教日转換 成字符 然后转成字符數奴 •/ 

33 char[] cnt ■ String.valueOf(count).toCharAri^ay(); 

34 

35 /• 从最大的数字 J 彳最小的，复制字符 */ 

36 for (char x : cnt) { 

37 array[index] - x; 

38 index++; 

39 > 

40 return index; 

41 } 

42 

43 int countCompression(String str) { 

44 /• 与之前实现栩同 */ 

45} 

跟第二种解法一样，执行 t 述代码的时间复杂度为 O(A0, 空间复杂度为0(^)。 

1.6 给定一福由 A/xW 矩阵表示的 ffi 像，其中每个像紫的大小为4字节， 期写一 个方法.将 
图像旋转90度。不占用额外内存空间能否做到？（第47页） 

解法 

要将矩阵旋转90度， 最简 单的做法就是一层一层进行旋转。对每一层执行环状旋转 （circular 
rotation ), 将上边移到右边、右边移到下边.下边移到左边.左边移到上边。 
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那么，该如何交换这四条边？一种做法是把上面复制到一个数组中，然后将左边移到上边、 
下边移到左边，等等。这需要占用内存空间，实际上没有必要。 

更好的做法是按索引一个一个进行交换，具体做法 如下： 


2 temp = top[i]; 

3 top[i] = left[i] 

4 left[i] ■ botton[i] 

5 bottom[i] * right[i] 

6 pight[i] « tenp 

从最外面一层开始逐渐向里，在每一层上执行上述交换。（另外，也可以从内层开始，逐层 
向外。） 

下面是该算法的实现代码。 


public void rotate(int[][] Matrix, int n) { 
for (int layer ■ 0 ; layer < n / 2; -M-layer) { 
int first ■ layer; 
int last ■ n - 1 - layer; 
for(int i - first; 1 < last; ++i) { 



// 存键上边 

int top ■ natrix[first][i]; 


// 左 《 上 

matrix[first][i] * «atrix[last-offset][first]; 


// 下釗左 

matrix[last-offset][first] ■ matrix[last][last - offset]; 


// 右到下 

matrix[last][last - offset] ■ matrix[i][last]; 


// 上到方 

matrix[l][last] - top; 


这个算法的时间复杂度为 Q ( A ^, 这已是最优的做法， W 为任何算法都需要访问所有 Y 个元素。 


1.7 编写一个算法，若 MxA / 矩阵中某个元素为0,则将其所在的行与列漓雩。（第47页） 

解法 

乍一看，这个问@似乎很 简单： 直接遍历整个矩阵，只要发现值为零的元素，就将其所在的 
行与列清零。不过这种方法有个 陷阱： 在读取被淸零的行或列时，读到的尽是零，于是所在行与 
列都得变成零。很快，整个矩阵的所有元素都会变为零。 

避开这个陷阱的方法之一，是新建一个矩阵标记零元素位置。然后，在第二次遍历矩阵时将 
零元素所在行与列清零。这种做法的空间复杂度为 G ( AflV )。 
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真的需要占用 0( MV ) 空间吗？不是的=既然打算将整行和整列清为零，因此并不需要准确记 
录它是 cell [2][4] (行2、列 4), 只需知道行2有个元素为零，列4有个元素为零。不管怎样，整 
行和整列都要清为零，又何必要记录零元素的确切位置？ 

下面是这个算法的实现代码。这里用两个数组分别记录包含零元素的所有行和列。然后，在 
第二次遍历矩阵时，若所在行或列标记为零，则将元素清为零。 


public void setZeros(int[][] matrix) { 

boolean[] row = new boolean[natrix.length]; 
boolean[] column » new boolean[natrix[ 0 ].length]; 


// 记承值为 0 的元素所在行索幻和列索幻 
for (int i = 0 ; i < matrix.length; i++) { 
for (int j ■ 0; j < matrix[ 0 ].length;j++) { 
if (matrix[i][j] ■- 0 ) { 
row[i] - true; 
column[j] ■ true; 


// 若行 i 或列 j 有个元素为 e, 則将 arr[i 】 [j 】 里为 0 
for (int i = 0 ; i < matrix.length; i++) { 
for (int j ■ 0; j < «atrix[ 0 ].length; { 
if (row[i] || column!j]) { 
matrix[i][j] - 0 ; 


为了提高空间利用率，我们可以选用位向 M 替代布尔数组。 


1.8 假定有一个方法 isSubstring . 可 检查一 个单词是否为其他字符串的子串。给定两个 
字符串 si 和 s 2, 请编写代码检查 s 2 是否为 si 旋转而成.要求只能调 用一次 isSubstring 。 （比 
如， waterbottle 是 erbottlewat 旋转后的字符串。 ）（ 第47页） 


解法 

假定 s2 由 si 旋转而成，那么，我们坷以找出旋转点在哪。例如，若以 wat 对 waterbottle 旋 
转，就会得到 erbottlewat 。 在旋转字符串时，我们会把 si 切分为两 部分： x 和 y , 并将它们重新 
组合成 S 2。 



因此，我们需要确认有没有办法将 si 切分为 x 和 y ， 以满足 xy = si 和 yx = s 2。 不论 x 和 y 之 
间的分割点在何处，我们会发现 yx 肯定是 xyxy 的子串。也即， S 2 总是 slsl 的子串。 
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上述分析正是这个问题的解法：直接调用 isSubstring ( slsl , s 2) 即可。 
下面是上述算法的实现代码。 

1 public boolean isRotation(String si. String s2) { 

2 int len = sl.length(); 

3 /* 检查 si 和 s2 是否等长且不为空 

4 if (len -= s2.length() && len > 0) { 

5 /* 摒接 si 扣 si, 放入新字符 ♦ 中 */ 

6 String slsl ■ si + si; 

7 return isSubstring(slsl, s2); 

8 } 

9 return false; 


9.2 链表 

2.1 编写代码.移除未排序链表中的重鬉结点。 

进阶 

如果不得使用临时缓冲区.该怎么解决？（第48页） 

解法 

要想移除链表中的重复结点，我们需要设法£录有娜钱是重复的。这里只要用到一个简单的 
散列表。 

在下面的解法中，我们会直接迭代访问整个链表，将每个结点加人散列表。若发现有重复元 
索，则将该结点从链表中移除.然后继续迭代。这个题 B 使用了链表. W 此只需扫描一次就能 

搞定。 

1 public static void deleteDups(LinkedListNode n) { 

2 Hashtable table - new Hashtable(); 

3 LinkedListNode previous ■ null; 

4 while (n I■ null) { 

5 if (table.containsKey(n.data)) { 

6 previous.next * n.next; 

7 } else { 

8 table.put(n.data , true); 

9 previous * n; 

10 > 

11 n * n.next; 


上述代码的时间复杂度为 O(A 0, 其中 W 为链表结点数 B。 

进阶： 不得使用缓冲区 

如不借助额外的缓冲区，可以用两个指针来 迭代： current 迭代访问整个链表， runner 用于 
检査后续的结点是否重复。 
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1 public static void deleteDups(LinkedListNode head) { 

2 if (head ― null) return; 

3 

4 LinkedListNode current = head; 

5 while (current != null) { 

6 /* 移除后缕值相同的所有結点 */ 

7 LinkedListNode runner * current; 

8 while (runner.next !• null) { 

9 if (runner.next.data =» current.data) { 

10 runner.next ■ runner.next.next; 



runner - runner.next; 



这段代码的空间复杂度为 0(1), 但时间复杂度为 C ^ A / 2 )。 

2.2 实现_个算法.找出单向链表中倒数第 /( 个结点。（第48页） 

解法 

下面会以递归和非递 IH 的方式解决这个问题。一般来说，递归解法更简洁，但效率比较差。 
例如，就这个问题来说，递归解法的代码 ft 大槪只有迭代解法的一半，但要占用0(«)空间，其中 
«为链表结点个数。 

注意，在下面的解法屮， A : 定义 如下： 传人 k = 1将返回最后一个结点 . k = 2返回倒数第2 
个结点，依此类推。当然，也可以将 k 定义为 k = 0返问最后一个结点。 


解法1:链表长度已知 

若链表长度已知，那么，倒数第结点就是第 (length - 10个结点。直接迭代访问链表就 
能找到这个结点。不过，这个解法太过简单了.不大可能是面试官想要的答案。 

解法2:递归 

这个算法会递归访问整个链表，当抵达链表末端时，该方法会回传一个置为0的计数器。 
之后的每次调用都会将这个计数器加1。当计数器等于 A 时，表示我们访问的是链表倒数第4个 
元素。 

实现代码简洁明了，前提是我们要有办法通过栈“回传” 一个整数值。可惜，我们无法用一 
般的返回语句回传一个结点和一个计数器，那该怎么办？ 

• 方法 A : 不返回该元素 

一种方法是对这个问题略作调整，只打印倒数第 a 结点的值。然后，直接通过返回值传回 
计数器值。 

1 public static int nthToLast(LinkedListNode head, int k) { 

2 if (head == null) { 

3 return 0; 



4 } 

5 int i = nthToLast(head.next, k) ♦ 1; 

6 if (i — k) { 

7 Systen.out.println(head.data); 

8 > 

9 return i; 

10 } 

当然，只有得到面试官的首肯，这个解法才算有效。 

• 方法 B : 使用 C ++ 

第二种解法是使用 C ++. 并通过引用传值。这样一来，我们就可以返回结点值，而且也能通 
过传递指针更新计数器。 


1 node* nthToLast(node* head, int k, int& i) { 
if (head ■■ NULL) { 
return NULL; 

} 

node • nd ■ nthToLast(head->next # k, 1); 
i - i -f 1; 
if (i ■■ k) { 
return head; 

} 

return nd; 



• 方法 c : 创建包裹类 

前面提到，这里的难点在于我们无法同时返回计数器和索引值。如果用一个简单的类（或一 
个单元素 数组） 包裹计数器值，就可以模仿按引用传递。 



public class IntUrapper { 

public int value » 0 ; 

> 

LinkedListNode nthToLastR2(LinkedlistNode head, int k, 
IntWrapper 1) { 

if (head » null) { 
return null; 

> 

I LinkedListNode node = nthToLastR2(head.next, k, i); 
i•value s i.value + 1 ; 
if (i.value « k) { // 找列綱敫第 k 个元素 
return head; 


因为有递归调用，这些递归解法都需要占用0(«)空间。 

还有不少其他解法这里并未提及。我们可以将计数器存放在静态变量中，或者，可以创建一 
个类，存放结点和计数器，并返回这个类的实例。不论选用哪种解法，我们都要设法更新结点和 
计数器，并在每层递归调用的栈都能访问到。 
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解法3:迭代法 

种 效率更高但不太直观的解法是以迭代方式实现。我们可以使用两个指针 pi 和 p 2, 并将它 
们指向链表中相距个结点的两个结点，具体做法是先将 pi 和 P 2 指向链表首结点，然后将 p 2 向前 
移动结点。之后，我们以相同的速度移动这两个指针， p 2 会在移动 LENGTH - k 步后抵达链表 
尾结点。此时， pi 会指向链表第 LENGTH - k 个结点，或者说倒数第 / Ph 结点。 

下面的代码实现了该箅法。 


LinkedListNode nthToLast(LinkedListNode head, int k) { 

if (k <■ 0 ) return null; 

LinkedListNode pi ^ head; 

LinkedListNode p2 * head; 

// p2 向前移动 k 个铀魚 

for (int i ■ 0 ; i < k - 1; i**) { 
if (p2 ■■ null) return null; // 锚设枝查 
p 2 ■ p 2 .next; 

} 

if (p 2 ■- null) return null; 

/* 現在以同样的速度移功 pi 和 p2, Sp2 抵达 蜓表末 足时， 

* pi 刚好栺甸铡數豕 k 个姑点 V 

while (p 2 .next !■ null) { 
pi ■ pi.next; 
p 2 ■ p 2 .next; 

} 

return pi; 


这个箅法的时间复杂度为 0( n ), 空间复杂度为0(1)。 


2.3 实 现一个 算法，删除单向链表中间的某个结点.假定你只能访问该结点。（第48页） 


解法 

在这个问题中，你访问不到链表的首结点，只能访问那个待删除结点。解法很简单，直接将 
后继结点的数据复制到当前结点，然后删除这个后继结点。 

下面是该算法的实现代码。 


1 public static boolean deleteNode(LinkedListNode n) { 

2 if (n null 11 n.next == null) { 

3 return false; // 失敗 

4 > 

5 LinkedListNode next * n.next; 

6 n.data = next.data; 



return true; 


注意，若待删除结点为链表的尾结点，则这个问题无解。没关系，面试官就是想要你指出这 
一点，并讨论该怎么处理这种情况。例如，你可以考虑将该结点标记为假的。 



2.4 编写代码，以给定值 x 为基准将链表分割成两部分，所有小于 x 的结点大于或等 
于 x 的结点之前。（第49页） 

解法 

要是链表换作数组，搬移元素时就要特别小心，因为搬移数组元素的开销很大。 

不过，移动链表的元素则要容易许多。我们不必移动和交换元素，可以直接创建两个 链表： 
—个链表存放小于 x 的元 素； 另一个链表存放大于或等于 x 的元素。 

我们会迭代访问整个链表，将元素插人 before 或 after ® 表。一旦抵达链表末端，则表明拆 
分完成，最后合并两个链表。 

下面是该方法的实现代码。 

1 /• 传入健 表的當蛄点 . 以及作为统表分 « 

2 * 基准的值 */ 

3 public LinkedListNode partition(LinkedListNode node, int x) { 

4 LinkedListNode beforeStart - null; 

5 LinkedListNode beforeEnd ■ null; 

6 LinkedListNode afterStart ■ null; 

7 LinkedListNode afterEnd ■ null; 

8 

9 /• 分刻鍵表 */ 

10 while (node !- null) { 

11 LinkedListNode next ■ node.next; 

12 node.next ■ null; 

13 if (node.data < x) { 

14 /• 将結点接入 beforett 表 V 

15 if (beforeStart ■■ null) { 

16 beforeStart - node; 

17 beforeEnd » beforeStart; 

18 } else { 

19 beforeEnd.next - node; 

20 beforeEnd - node; 

21 > 

22 > else { 

23 /• 将結点接入 after 鍰表 V 

24 if (afterStart ■■ null) { 

25 afterStart = node; 

26 afterEnd ■ afterStart; 

27 } else { 

28 afterEnd.next - node; 

29 afterEnd = node; 

30 > 

31 > 

32 node - next; 

33 } 

34 

35 if (beforeStart == null) { 

36 return afterStart; 

37 > 

38 

39 /* 合并 before 和 after 缝表 */ 
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40 beforeEnd.next = afterStart; 

41 return beforeStart; 

42 } 

为了追踪两个链表却要维护四个变 M , 你可能觉得有点碍眼，不少人都有同感。我们可以移 
除其中部分变量，不过代码执行效率会略打折扣。效率降低的原因在于遍历整个链表的时间略微 
延长。不过，大 M 示的时间复杂度仍保持不变，同时代码也变得更简短、扼要。 

第二种解法略有不同。结点不再追加至 before 和 after * 链表的末端，而是插人这两个链表 
的前端。 


1 public LinkedListNode partition(LinkedListNode node, int x) { 

2 LinkedListNode beforeStart = null; 

3 LinkedListNode afterStart ■ null; 


22 

23 


/* 分 利缒表 V 
while (node I a null) { 

LinkedListNode next = node.next; 
if (node.data < x) { 

/* 将蛄点核入 beforett 表的酧 鸪 
node.next ■ beforeStart; 
beforeStart * node; 

> else { 

/* 将蛄点接入 aftertt 表的锊端 •/ 
node.next ■ afterStart; 
afterStart ■ node; 

> 

node ■ next; 


/* 合并 before 键表和 afteril 表 •/ 
if (beforeStart *■ null) { 



/* 定位至 beforett 表束合并甬个鍵表 V 
LinkedListNode head = beforeStart; 
while (beforeStart.next !■ null) { 
beforeStart » beforeStart.next; 

> 

beforeStart.next ■ afterStart; 


33 


注意，解决这个问题时，必须非常小心地处理 null 值。再看看上面第7行代码，为什么要有 
这行代码？这是因为在循环访问链表时，也会修改这个链表。我们必须用临时变量记下后继结点， 
这样才能知道下一次迭代要用到该后继结点。 
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2.5 给定两个用链表表示的整数.每个结点包 含一个 数位。这些数位是反向存放的，也就 
是个位排在链表首部。编写函数对这两个整数求和，并用链表形式返回结果。 

进阶 

假设这些数位是正向存放的，请再做_«。（第49页） 


解法 

着手解决这个问題之前，有必要问顾一下加法是怎么冋事， 比如: 


首先，7加5得到12。其中，2为结果12的个位，1则为十位相加时的进位。然后，将1、1和9 
相加，得到11。十位数字为1,另一个1则成为下一步运算的进位。最后，将1、6和2相加得到9。 
因此，这两个整数求和的结果为912。 

我们可以递归地模拟这个过程，将两个结点的值逐一相加，如有进位则转人下一个结点。下 
面以两个链表为例进行 说明： 



步骤如下。 

(1) 首先，将7和5相加，结果为12,则2成为结果链表的第一个结点，并将1进位给下一次求 
和运算。 


健夂： 2 -> ? 

(2) 然后，将1、9和上面的进位相加，结果为11,于是1成为结果链表的第二个元素，另一个 
1则进位给下一个求和运算。 

嬈表： 2 -> 1 -> ? 

(3) 最后，将6、2和上面的进位相加，得到9,同时也成为结果链表的最后一个元索„ 

鍵表： 2 -> 1 -> 9 

下面是该算法的实现代码。 

1 LinkedListNode addLists(LinkedListNode 11, LinkedListNode 12, 

2 int carry) { 

3 /• 两个线表全部为空且进位为 0. 則 A 跃返回 */ 

4 if (XI == null && 12 == null && carry == 0) { 

5 return null; 

6 } 

7 

8 LinkedListNode result = new LinkedListNodeO; 

9 

10 ■* 将 value 以及 11 和 12 的 data 相加 V 

11 int value = carry; 

12 if (11 != null) { 

13 value += 11.data; 
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14 > 

15 if (12 !■ null) { 

16 value +* 12.data; 

17 } 

18 

19 result.data = value X 10; /* 求 和姑果 的个位 */ 

20 

21 /* 遂归 V 

22 LinkedListNode more = addLists(ll ■■ null ? null : 11.next, 

23 12 == null ? null : 12.next, 

24 value >= 10 ? 1 : 0); 

25 result.setNext(more); 

26 return result; 

27 > 

在实现这段代码时，务必注意处理一个链表比另一个链表结点少的情况。我们可不想碰到空 
指针异常。 

进阶 

从概念上来说，第二部分并无不同（递归，进位处理)，但在实现时相微复杂一些。 

(1) —个链表的结点可能比另一个链表的少，我们无法直接处理这种情况。例如，假设要对 
(1 -> 2 -> 3 -> 4) 与 (S -> 6 -> 7) 求和。务必注意，5应该与2而不是1配对。对此，我们可 
以一开始先比较两个链表的长度并用零填充较短的链表。 

(2) 在前一个问题中，相加的结果不断追加到链表尾部（也即向前传递)。这就意味着递归调 
用会传人进位，而且会返 W 结果（随后追加至链表尾部)。不过，这里的结果要加到首部（也即 
向后传递)。跟前一个问埋一样，递归 谰用必 须返回结果和进位。实现也不是太难，但处理起来 
会更难一些，可以通过创建一个 PartialSum 包裹类来解决这一点。 

下面是该算法的实现代码。 

1 public class PartialSum { 

2 public LinkedListNode sun ■ null; 

B public int carry ■ 0; 

4 } 

5 

6 LinkedListNode addLists(LinkedListNode 11 } LinkedListNode 12) { 

7 int lenl - length(ll); 

8 int len2 = length(12); 

9 

10 /* 用零填充较椬的鍵表 . 参看注解（ 1> •/ 

11 if (lenl < len2) { 

12 11 = padList(ll, len2 - lenl); 

13 > else { 

14 12 = padList(12, lenl - len2); 

15 > 

16 

17 /* 对两个健表求和 */ 

18 PartialSum sum = addListsHelper(11, 12); 

19 

20 /* 如有进位，則插入鍵表首部 . 否 M , 直接返田 
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21 * 整 个键表 V 

22 if (sum.carry == 0) { 

23 return sum.sum; 

24 } else { 

25 LinkedListNode result ■ insertBefore(sum.sun, sum.carry); 

26 return result; 

27 > 

28 } 

29 

30 PartialSua addListsHelper(LinkedListNode 11, LinkedListNode 12) { 

31 if (11 » null && 12 ** null) { 

32 PartialSum sum ■ new PartialSu«(); 

33 return sum; 

34 > 

35 /* 对较小数字遂 _ 求和 V 

36 PartialSum sum - addListsHelper(ll.next J 12.next); 

37 

38 /* 将进位和务前敦据栩加 •/ 

39 int val ■ sun.carry + 11•data ♦ 12.data; 

40 

41 /• 插入#莳數字的求扣 4 果 V 

42 LinkedListNode full_result - insertBefore(sun.sun^ val X ie); 

43 

44 /• 返田求扣蛣果扣进位 ; V 

45 sum.sum - full_result; 

46 sum.carry - val / 10; 

47 return sum; 

48 } 

49 

50 /• 用零填充鍵表 */ 

51 LinkedListNode padList(LinkedListNode 1, int padding) { 

52 LinkedListNode head - 1; 

53 for (int i - e ； i < padding; { 

54 LinkedListNode n ■ new LinkedListNode(0 # null, null); 

55 head.prev ■ n; 

56 n.next - head; 

57 head ■ n; 

58 > 

59 return head; 

60 > 

61 

62 /• 補助 A 数，将结点 接入键 表首部 V 

63 LinkedListNode insertBefore(LinkedListNode list, int data) { 

64 LinkedListNode node ■ new LinkedListNode(data, null, null); 

65 if (list I■ null) { 

66 list.prev *> node; 

67 node.next * list; 

68 > 

69 return node; 

7” 

注意，上面的代码已将 insertBefore ()、 padList () 和 length (> ( 未列出）单列为独立方 
法。这样一来，代码更清晰更易读，在面试时这么做非常可取！ 
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2.6 给定一个有环链表，实现一个算法返回环路的幵头结点。（第49页） 

解法 

这个问題是由经典面试题——检测链表是否存在环路一演变而来。下面我们将运用模式匹 
配法来解决这个问题。 


第1 部分： 检测链表是否存在环路 

检测链表是否存在环路，有一种简单的做法叫 FastRunner / SlowRunner 法。 FastRunner — 次 
移动两步，而 SlowRimner —次移动一步。这就好比两辆赛车绕着同一条赛道以不同的速度前进， 
最终必然会碰到一起。 

聪明的读者可能 会问： FastRunner 会不会刚好“越过" SlowRunner , 而不发生碰撞呢？绝 
无可能。假设 FastRunner 真的越过了 SlowRunner , 且 SlowRunner 处于位置 i , FastRunner 处于 
位置 i + 1。 那么，在前一步， SlowRunner 就处于位置 i - 1, FastRunner 处于位置 （（i + 1)- 
2〉或 i - 1。也就是说，两者 碰在起 了。 

第2 部分： 什么时候碰在一起？ 

假定这个链表有一部分不存在环路， 长度为 k。 

若运用第1部分的算法， FastRunner 和 SlowRunner 什么时候会碰在一起呢？ 

我们知道， SlowRunner 每走 p 步， FastRunner 就会走 2 p 步。因此，当 SlowRunner 走了 k 步进 
入环路部分时， FastRunner 已走了总共 2 k 步，进人环路部分已有 2 k - k 步或 k 步。由于 k 可能比环 
路长度大得多，实际上我们应该将它写作 mod ( k , LOOP _ SIZE > 步，并用 K 表示。 

对于之后的每一步， FastRunner 和 SlowRunner 之间不是走远一步就是更近一步，具体要看 
观察的角度。也就是说，因为两者处于圆 阍中， qA 以远离 B 的方向走出 q 步时，同时也是向 B 更 
近了 q 步。综上，我们得出以下 几点： 

(1) SlowRunner 处于环路中的0步位置； 

(2) FastRunner 处于环路中的 K 步位置； 

(3) SlowRunner 落后于 FastRunner * ，相距 K 步； 

(4) FastRunner 落后于 SlowRunner , 相距 LOOP_SIZE - K 步； 

(5) 每过一个单位时间， FastRunner 就会更接近 SlowRunner —步。 

那么，两个结点什么时候相遇？若 FastRunner 落后于 SlowRunner , 相距 LOOP_SIZE - K 步， 
并且每经过一个单位时间， FastRunner 就走近 SlowRunner —步，那么，两者将在 LOOP_SIZE - K 
步之后相遇。此时，两者与环路起始处相距 K 步，我们将这个位置称为 CollisionSpot 。 

第3 部分： 如何找到环路起始处？ 

现在我们知道 CollisionSpot 与环路起始处相距 K 个结点。由于 K = mod ( k , LOOP _ SIZE 〉 （或 
者换句话说 ， k = K + M * LOOP _ SIZE ,其中 M 为任意整数），也可以说， CollisionSpot 与环路 
起始处相距 k 个结点。例如，若有个环路长度为5个结点，有个结点 N 处于距离环路起始处2个结 
点的地方，我们也可以换个 说法： 这个结点处于距离环路起始处7个、12个甚至397个结点。 
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至此， CollisionSpot 和 LinkedListHead 与环路起始处均相距 k 个结点。 

现在，若用一个指针指向 CollisionSpot ,用另一个报针抱向 LinkedListHead ,两者与 
LoopStart 均相距 k 个结点。以同样的速度移动，这两个指针会再次碰在一起一这次是在 k 步之 
后，此时两个指针都指向 LoopStart , 然后只需返 M 该结点即可。 

第4 部分： 将全部整合在一起 

总结一下， FastPointer 的移动速度是 SlowPointer 的两倍。 IsiowPointer 走了 k 个结点进 
人环路时， FastPointer 已进人链表环路 k 个 结点。 也就是说 FastPointer 和 SlowPointer 相距 
LOOP_SIZE - k 个结点。 

接下来，若 SlowPointer 毎走一个结点， FastPointer 就走两个结点，毎走■-次，两者的距 
离就会更近一个结点。因此，在走了 LOOP_SIZE - k 次后，它们就会碰在一起。这时两者距离环 
路起始处有 k 个结点。 

链表首部与环路起始处也相距 k 个结点。因此，若其中一个指针保持不变，另一个指针指向 
链表首部，则两个指针就会在环路起始处相会。 

根据第1、2、3部分，就能直接导出下面的算法。 

(1) 创建两个指针： FastPointer 和 SlowPointerv 

(2) SlowPointer 每走一步， FastPointer 就走两步。 

(3) 两者碰在一起时，将 SlowPointer 指向 LinkedListHead , FastPointer 保持不变。 

(4) 以相同速度移动 SlowPointer 和 FastPointer , —次一步，然后返回新的碰插处。 

下面是该算法的实现代码。 

1 LinkedListNode FindBeginning(LinkedListNode head) { 

2 LinkedListNode slow = head; 

3 LinkedListNode fast = head; 

4 

5 /* 找出砝撞处，将处于键表中 LOOP_SIZE - k 步的 

6 • 位罝 V 

7 while (fast != null && fast.next != null) { 

8 slow = slow.next; 

9 fast = fast.next.next; 

10 if (slow == fast) { // 砝撞 

11 break: 



128 第 9 章解題技巧 


/* 锊误检查，没有碰撞处，也即没有跖路 */ 
if (fast == null 11 fast.next null) { 



/* 将 slow 相句 賁年， fast 指向砝撞处，两者 
* 茈离环路起始处 k 步 . 若两者以相同速度移动 . 
* 刻必 定会在坏路起始处磁在一起 V 
slow = head; 
while (slow I■ fast) { 


slow = slow.next; 



/* 至此两者均指向环路起始处 V 
return fast; 


2.7 编写一个函数，检查链表是否为回文。（第 49 页） 

解法 

要解决这个问题，可以将回文 （ palindrome ) 定义为0 -> 1 •> 2 -> 1 -> 0 。显然，若链 
表是冋文，不管正着看还是反着看，都是一样的。由此可以得出第一种解法。 

解法1:反转并比较 

第一种解法是反转整个链表，然后比较反转链表和原始链表。若两者相同，则该链表为冋文。 
注意，在比较原始链表和反转链表时，其实只需比较链表的前半部分。若原始链表和反转链 
表的前半部分相同，那么，两者的后半部分肯定相同。 


解法2:迭代法 

要想探测链表的前半部分是否为后半部分反转而成，该怎么做呢？只需将链表前半部分反 
转，可以利用栈来实现。 

我们需要将前半部分结点人找。根据链表长度已知与否，人找有两种方式。 

若链表长度已知，可以用标准 forit 代访问前半部分结点，将每个结点人栈。当然，要小心处 
理链表长度为奇数的情况 3 

若链表长度未知，可以利用本章开头描述的快慢 _ er 方法迭代访问链表。在迭代循环的每 
一步，将慢速 runner 的数据人找。在快速 runner 抵达链表尾部时，慢速 runner 刚好位 T 链表中间位 
置。 至此，栈里就#放了链表前半部分的所有结点，不过顺序是相反的。 

接下来，我们只需迭代访问链表余下结点。每次迭代时，比较当前结点和栈顶元素，若完成 
迭代时比较结果完全相同，则该链表是回文序列。 

1 boolean isPalindrome(LinkedListNode head) { 

2 LinkedListNode fast ■ head; 
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30 


LinkedListNode slow = head; 


Stack<Integer> stack = new Stack<Integer>(); 


I * 将链表 前半部分元索入钱.当伕速 runner (移动速度为 
* 慢連 runner 的两倍）到达鍵表足部吋，«慢速 runner 己 
* 处在链表中 闻位置 */ 

while (fast !■ null && fast.next !* null) { 
stack.push(slow.data); 
slow » slow.next; 
fast - fast.next.next; 


/* *1 表有+数个元索，瓞过中间元索 */ 
if (fast !■ null) { 
slow * slow.next; 


while (slow 1= null) { 

int top ■ stack.pop().intValue(); 

/• 角 者不柄 W , 則该缒表 不是田丈序列 •/ 
if (top !■ slow.data) { 
return false; 

} 

slow * slow.next; 

> 

return true; 


解法 3: 递归法 

首先，简要介绍下面的解法用到的 记号： 用记号 W 示结点时，变贵尺指示结点数据的值， 
而 x ( 取 f 或 b ) 指示该结点是值为尺的前方结点还是后方结点。例如，在下面的链表中，结点 3 b 
指的足值为3的第二个 （b — back . 即后方）结点。 

接下来，跟许多链表问题一样，可以用递归法解决这个问题。我们靠直觉可能就会想到要比 
较元素0和元素 n , 元素1和元素 zi -1, 元素2和元素 n -2, 等等，直至中间元素。 

例如： 


为了运用这种方法，首先必须知道什么时候到达中间元素，这也形成了递归的终止条件。每 
次递归调用传人 length - 2为长度，当长度等于0或1时，表明当前已处于链表中间位置。 

1 recurse(Node n, int length) { 

2 if (length == 0 丨丨 length == 1 ) { 

3 return [something ]; "中间 


recurse(n.next, length - 2); 
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这个方法构成了 isPalindrome 方法的轮廓，而该算法的实质则是比较结点 i 和结点 n - i , 
检査链表是否为回文序列。具体该怎么做呢？ 

仔细分析下面的调 用栈： 

1 vl * isPalindrone: list =0(1(2(3)2)1)0. length = 7 

2 v2 ■ isPalindrome: list -1(2(3)2)1)0. length = 5 

3 v3 * isPalindroiie: list «2(3)2)1)0. length ■ B 

4 v4 = isPalindrome: list *3)2)1) 0. length - 1 



在上面的调用找中，每次调用都会比较其首结点和链表后半部分对应结点，检査链表是否为 
回文序列 。即： 

口第1行需要比较结点 0 f 和结点 0 b ; 

□ 第2行黹要比较结点 If 和结点 lb ; 

.□ 第3行需要比较结点扦和结点此； 

□ 第 4 ft 需要比较结点 3 f 和结点 3 b 。 

若将上面的栈倒过来.按如下顾序传回结点，我们只 X : 

□第4^发现传人结点为中间结点（因为 length = 1 ), 传回 head . next 。 其中 head 为结点3, 
因此 head . next 为结点 2 b ; 

□ 第3行比较首部即结点 2 f 和 returne < l_node (上次递归调用返回的值）即结点 2 b 。 若两个 
结点的值相等，则传冋结点 lb 的引用 ( returned _ node . next ); 

口第2行比较首部 （ 结点 If ) 和 r'eturneiLnode ( 结点 lb >。若两个结点的值相等，则传回结 
点 0 b 的引用 

□ 第1行比较首部 （ 结点 0 f ) 和 returned _ node ( 结点 0b )。若两个结点的值相等，则返回 ture 。 
归纳一下，每次调用都会比较其首部和 returned _ node , 然后回传 returned _ node . next 。 
最终每个结点 i 都会与结点 n - i 进行比较。只要有任意一对结点的值不相等，就立^卩返回 false , 
调用栈 的上级 调用都会检査这个布尔值。 

但是等等，你可能会问，我们一会儿说要返回一个布尔值，一会儿说要返回一个结点？到底 
返回什么？ 

两个都要返回。我们创建了一个包含布尔值和结点两个成员的简单类，调用时只需返回该类 
的实例。 

1 class Result { 

2 public LinkedListNode node; 

3 public boolean result; 

4 } 

下面举例说明示例链表每次递归调用的参数和返冋值。 

1 isPalindrome: list =0(1(2(3(4)3)2)1)0. len = 9. 

2 isPalindrome: list «1(2(3(4)3)2)1)0. len=7 
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3 isPalindrome: list =2(3(4>3)2>1)0. len=5 

4 isPalindrome: list - 3 ( 4 ) 3 ) 2 ) 1 ) 0. len - 3 

5 isPalindrone: list «4)3)2)1)0. len * 1 

6 returns node 3b ， true 

7 returns node 2b, true 

8 returns node lb, true 

9 returns node 0b, true 

10 returns nobe 0b, true 

至此，这段代码实现起来很简单，只需填人细节即可。 

1 Result isPalindromeRecurse(LinkedListNode head, int length) { 

2 if (head == null || length == 0) { 

3 return new Result(null f true); 

4 } else if (length ― 1) { 

5 return new Result(head.next , true); 

6 } else if (length ■■ 2) { 

7 return new Result(head.next.next , 

8 head.data =■ head.next.data); 

9 > 

10 Result res ■ lsPalindromeRecurse(head.next, length - 2); 

11 if (Ires.result || res.node null) { 

12 return res; 

13 > else { 

14 res.result » head.data »■ res.node.data; 

15 res•node ■ res.node.next; 

16 return res; 

17 > 

18 } 

19 

20 boolean isPallndroffle(LinkedListNode head) { 

21 Result p * isPalindromeRecurse(head, listSize(head)); 

22 return p.result; 

23 > 

有些人可能会有疑问，为什么要这么费力专门创建一个 Result 类，有没有更好的办法？还真 
没有，至少用 Java 实现的话没有。 

然 IW , 若用 C 或0+实现的话，我们可以传人一个指针的指针。 

1 bool isPallndromeRecurse(Node head, int length. Node** next) { 

2 參■參 

3 > 

代码不太好看，但行之有效。 

9.3 栈与队列 


3.1 描述如何只用一个数组来实现三个栈。（第50页） 

解法 

和许多问題一样，这个问题的解法基本上取决于你要对栈支持到什么程度。若每个栈分配固 
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定大小的空间，就能满足需要，那么照做便是。不过，这么做的话，有可能其中一个栈的空间不 
够用了，而同时其他的栈却几乎是空的。另一种做法是弹性处理栈的空间分配，但这么一来， 
这个问题的复杂度又会大大增加。 

方法1:固定分割 

我们可以将整个数组划分为=等份，将每个栈的增长限制在各自的空间里。 注意： 记号“[” 
表示包含端点， “(" 表示不包含端点。 

□栈1，使用 [0, n /3). 

口栈2,使用 [ n /3, 2 n /3)» 

□ 栈3,使用 [2 n /3, n )。 

下而是该解法的实现代码。 

1 int stackSize = lee ； 

2 int[] buffer = new int [stackSize * B]; 

3 int[] stackPointer - {-1,-1, -1>; // 用于追綜找 1 * 元索的指针 

4 

5 void push(int stackNum, int value) throws Exception { 

6 /• 检查有无 空闲空 1*1 •/ 

7 if (stackPointer[stackNum] ♦ 1 >• stackSize) { // 最后一个元景 

8 throw new Exception("Out of space. u ); 

9 > 

10 /* 栈指针 6 增.然后史新 栈顶元 素的值 */ 

11 stackPointer [ stackNum]-f+; 

12 buffer[absTopOfStack(stackNun)] - value; 

13 > 

14 

15 int pop(int stackNum) throws Exception { 

16 if (stackPointer[stackNum] ― -1) { 

17 throw new Exception( w Trying to pop an empty stack.**); 

18 } 

19 int value = buffer[absTopOfStack(stackNum)]; // 获取栈項元素的值 

20 buffer[absTopOfStack(stackNun)] - 0; // 清聿指定索幻元索的值 

21 stackPointer[stackNum]--; // 指针 fl 減 

22 return value; 

23 > 

24 

25 int peek(int stackNum) { 

26 int index ■ absTopOfStack(stackNum); 

27 return buffer[index]; 

28 } 

29 

30 boolean isEmpty(int stackNum) { 

31 return stackPointer[stackNum] == -1; 

32 > 

33 

34 /* 返回栈 “stackNu ■尸栈 《 元素的索幻，绝对量 •/ 

35 int absTopOfStack(int stackNum) { 

36 return stackNum • stackSize + stackPointer[stackNum]; 

37 > 
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如果知道与这些栈的使用情况相关的更多信息，就可以对上面的算法做相应的改进。例如， 
若预估 Stack 1 的元素比 Stack 2 多很多，那么，就可以给 Stack 1 多分配一点空间，给 Stack 2 
少分配一些空间。 

方法2:弹性分割 

' 第二种做法是允许找块的大小灵活可变。当一个栈的元素个数超出其初始容量时，就将这个 
找扩容至许可的容量，必要时还要搬移元素。 

此外，我们会将数组设计成环状的，最后一个栈可能从数组未尾开始，环绕到数组开头。 

请注意，这种解法的代码远比面试中常见的要复杂得多。你可以试着提供伪码，或是其中某 
几部分的代码，但要完整实现的话，难度就有点大了。 

1 /* StackData* 个 R 单的*.存放 4 •个钱柚关的数 *. 

2 • 但并本存放钱的实际元素 •/ 

3 public class StackData { 

4 public int start; 

5 public int pointer; 

6 public int size - 0; 

7 public int capacity; 

8 public StackData(int _start, int —capacity) { 

9 start - _start; 

10 pointer ■ _start - 1; 

11 capacity ■ —capacity; 

12 > 

13 

14 public boolean isWithinStack(int index, int total_size) { 

15 /* 注意： 如果栈 田芘了， 首部（右侧）田 fitil 

16 * 左边 */ 

17 if (start <* index && Index < start + capacity) { 

18 // 不田 ft, 或田 ft 时的 " 賁部 ~ ( 言铜 > 

19 return true; 

20 } else if (start ♦ capacity > total_size && 

21 index < (start + capacity) X total_slze) { 

22 // 固 ft 时的毛部（左麴〉 

23 return true; 

24 > 

25 return false; 

26 > 

27 } 

28 

29 public class QuestionB { 

30 static int number_of__stacks - 3; 

31 static int default_size = 4; 

32 static int total_size = default_size * number_of_stacks; 

33 static StackData [] stacks = {new StackData(0, default_size), 

34 new StackData(default_size, default_size>, 

35 new StackData(default_size ♦ 2, default_size)}; 

36 static int [] buffer = new int [total—size]; 

37 

38 public static void main(String [] args) throws Exception { 

39 push(0, 10); 



章解題技巧 


1, 20)； 

2, 30 )； 

，： Pop(0 )； 


static int numberOfElements() { 

■n stacks[0].size ♦ stacks[l】.size + stacks[2].size; 


static int nextElement(int index) { 
ndex + 1 ■■ total_size) return 0; 
return index + 1 ; 


static int previousElenent(int index) 
ndex ■■ 0 ) return total_size - 1 ; 
return index - 1; 


static void shift(int stackNum) 


// 以相反順+极移 


// 躊出若干空间 


stack.isWlthlnStack(i 4 total_slze); 
i ■ previousElenent(i)) { 
buffer[i] ■ buffer[previousElenent(i)]; 


buffer[stack.start] * 0 ; 

stack, start = next Element (stack, start); // 移动 ft 的起始位里 
stack, pointer = next Element (stack, pointer); // 移动相针 
stack.capacity--; // 恢复列原先的容量 


/* 搬移到其他钱上，以圹大栈的容量 V 
public static void expand(int stackNua) { 
shift((stackNum ♦ 1) % number_of_stacks); 
stacks [stackNum] .capacity^; 


public static void push(int stackNun, int value) 
throws Exception { 

StackData stack = stacks[stackNum]; 

/* 检查空间 够不爷 V 

if (stack.size >= stack.capacity) { 

if (numberOfElementsO >= total_size) { // 全部部满了 
throw new Exception( ff Out of space."); 
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117 
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> else { // 只是需要极移元素 
expand(stackNum) ; 


/* 找出《端元素在数組中 的索？ I 值 . 并加 1 . 

* 并增加找指 4t V 
stack. size-M-; 

stack.pointer = nextElement(stack.pointer); 
buffer[stack.pointer] * value; 


public static int pop(int stackNum) throws Exception { 
StackData stack » stacks[stackNum]; 

if (stack.size — 0 ) { 

throw new Except ion ( ,# Trying to pop an empty stack. M ); 

> 

int value » buffer[stack.pointer]; 
buffer[stack.pointer] - 0 ; 

stack.pointer = previousElement(stack.pointer); 
stack.size--; 
return value; 


public static int peek(int stackNum) { 
StackData stack = stacks[stackNum); 

return buffer[stack.pointer]; 


public static boolean isEmpty(int stackNun) { 
StackData stack ■ stacks[stackNum]; 

return stack.size ■■ 0 ; 


遇到类似的问题，应该力求编写清晰、可维护的代砰，这很重要。你应该引人额外的类，比 
如这里使用了 StackData , 并将大块代码独立为单独的方法。当然，这个建议同样适用于真正的 
软件开发。 


3.2 请设计一个栈，除 p 叩与 push 方法，还支持 min 方法.可返回栈元素中的最小值。 
push 、 pop 和 min 三个方法的时间 爱杂度 必须为0(1)。（第50页） 

解法 

既然是最小值，就不会经常变动，只有在更小的元素加入时，才会改变。 

一种解法是在 Stack 类里添加一个 int 型的 minValue 。 当 ntinValue 出找时，我们会搜索整个 
栈，找出新的最小值。可惜，这不符合入栈和出栈操作时间为 0(1) 的要求。 

为进一步理解这个问题，下面用一个简短的例子加以 说明： 


push ⑸； " 钱为 {S}, 最小值为 s 
push(6 )； // 栈为 {6, 5h 最小值为 5 
push(3); // 线为 {3, 6, S}, 最小值为 3 
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push ⑺；"«*{7, 3, 6, 5}. 最小值为3 
popO ； //弹出7,找为 {3, 6, 5}, 最小值为3 
pop (); // 洋出 3,钱为 {6, S }, 最小值 *S 

注意观察，当栈回到之前的状态 （{6, S }) 时，最小值也回到之前的状态 （ 5 这就导出了 
我们的第二种解法。 

只要记下每种状态的最小值，我们就能轻易获取最小值。实现很简单，每个结点记录当前最 
小值即可。这么一来，要找到 min , 直接査看栈顶元素就能得到最小值。 

当一个元素人栈时，该元素会记下当前最小值，将 min 记录在自身数据结构的 min 成员中。 

1 public class StackWithHin extends Stack<NodeWithMin> { 

2 public void push(int value) { 

3 int newMin s Math._in(value, 

4 super.push(new NodeWithHin(value, newMin)); 

5 > 

6 

7 public int _in() { 

8 if (this.isEmptyO) { 

9 return Integer.MAX_VALUE; // 嬤误值 

10 > else { 

11 return peek().min; 

12 > 

13 } 

14 } 

15 

16 class NodeMithMin { 

17 public int value; 

18 public int min; 

19 public NodeWithHin(int v, int niin){ 

20 value - y; 

21 this.min ■ min; 

22 > 

23 } 

但是，这种做法有个 缺点： 当找很大时，每个元素都要记录就会浪费大量空间。还有 
没有更好的做法？ 

利用额外的栈来记录这钱 min ，我们也许可以比之前做得更好一点。 

1 public class StackWithHin2 extends Stack<Integer> { 

2 Stack<Integer 〉 s2; 

3 public StackWithMin2() { 

4 s2 * new Stack<Integer>(); 

5 > 

6 

7 public void push(int value){ 

8 if (value <= nin()) { 

9 s2.push(value); 

10 > 

11 super.push(value); 

12 > 

13 

14 public Integer pop() { 
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15 int value = super.pop(); 

16 if (value == min()) { 

17 s2.pop(); 

18 > 

19 return value; 

20 > 

21 

22 public int min() { 

23 if (s2.isEmpty()) { 

24 return Integer.HAX_VALUE; 

25 > else { 

26 return s 2 .peek(); 

27 > 

28 > 

29 } 

为什么这么做可以节省空间？假设有个很大的栈，而第一个元素刚好是最小值。对于第一种 
解法，我们需要记录；》个整数，其中《为栈的大小。不过， 对丁第 二种解法，我们只需存储几项数 
据： 第二个桟（只有一个元索），以及栈本身数据结构的若干成员。 

3.3 设想 有一堆 盘子，堆太高可能会倒下来。因此.在现实生活中，盘子 堆到一 定高度 
时，我们就会另外堆一堆盘子。请实现数据结构 SetOfStacks . 模拟这种行为。 SetOfStacks 
应该由多个栈组成，并且在前 —个找 填满时新建一个栈。此外. SetOfStacks . push 0和 
SetOfStacks . p 叩 （） 应该与普通栈的操作方法相同（也就是说， pop () 返回 的值. 应该跟 只有一 
个栈时的情况一样)。 

进阶 

实现一个 popAt(int index ) 方法，根据指定的子栈，执行 pop 操作。（第51页） 

解法 

在这个问题中，根据题意，数据结构应该类似 如下： 

1 class SetOfStacks { 

2 ArrayList<Stack> stacks = new ArrayList<Stack>(); 

3 public void push(int v) { ... } 

4 public int pop(){...} 

5 ) 

其中 push ( 〉的行为必须跟单一栈的一样，这就意味着 pushO 要对栈数组的最后一个栈调用 
pushO 。 不过，这里处理起来必须小心 一点： 若最后一个找被填满，就需新建一个找。实现代码 
大致 如下： 

1 public void push(int v) { 

2 Stack last * getLastStack(); 

3 if (last 1= null && !last.isFull()) { // 添加到最后一个栈中 

4 last.push(v); 

5 } else { // 必 須新建一个栈 

6 Stack stack = new Stack(capacity); 



stacks.add(stack); 
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9 } 

10 } 

那么， pop () 该怎么做？它的行为与 pushO 类似，也就是说，应该操作最后一个桟。若最后 
一个栈为空 （ 执行出找操作后），就必须从栈数组中移除这个栈。 

1 public int pop() { 

2 Stack last = getLastStack(); 

3 int v * last.pop(); 

4 if (last.size == 0 〉 stacks.re«ove(stacks.size() - 1); 

5 return v; 

6 > 


进阶：实现 p 叩 At<int index} 

这个实现起来有点棘手，不过，我们可以设想一个“推人”动作。从栈1弹出元索时.我们 
需要移出找2的栈底元素，并将其推到找1中。随后，将找3的找底元素推入栈2,将栈4的栈底元 
素推人栈3,等等。 

你可能会指出，何必执行“推人”操作，有些栈不填满不是也挺好的。而且，这还会改善时 
间复杂度（元素很多时尤其明显），但是，若之后有人假定所有的栈（最后一个栈除外）都是填 
满的，就可能会让我们陷人棘手的境地。这个问埋并没有“标准答案”，你应该跟面试官讨论各 
种做法的优劣。 

1 public class SetOfStacks { 

2 ArrayList<Stack> stacks ■ new ArrayList<Stack>(); 

3 public int capacity; 

4 public SetOfStacks(int capacity) { 

5 this.capacity ■ capacity; 

6 > 

7 

8 public Stack getLastStack() { 

9 if (stacks•size()■■ 0) return null; 

10 return stacks.get(stacks.size() - 1 ); 

11 } 

12 

IB public void push(int v) { /• 本看之前的代碼 •/ } 

14 public int pop() { /* 参看之前的代碼 V } 

15 public boolean isEmptyO { 

16 Stack last = getLastStack(); 

17 return last » null || last.isEnpty(); 

18 } 

19 

20 public int popAt(int index) { 

21 return leftShift(index, true); 

22 } 

23 

24 public int leftShift(int index, boolean removeTop) { 

25 Stack stack = stacks.get(index); 

26 int renoved_ite«i; 

27 if (removeTop) removed_ite« = stack.pop(); 

28 else removed_item = stack.removeBottom(); 
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29 if (stack.isE«pty()) { 

30 stacks.reaove(index); 

31 > else if (stacks.size() > index + 1) { 

32 int v = leftShift(index + 1, false); 

33 stack.push(v); 

34 } 

35 return renoved_iteiii; 

36 > 

37 } 

38 

39 public class Stack { 

40 private int capacity; 

41 public Node top, bottoa; 

42 public int size - 0; 

43 

44 public Stack(int capacity) { this•capacity ■ capacity; } 

45 public boolean isFull() { return capacity " size; } 

46 

47 public void join(Node above. Node below) { 

48 if (below !■ null) below.above - above; 

49 if (above !» null) above.below « below; 

50 > 

51 

52 public boolean push(int v) { 

53 if (size >■ capacity) return false; 

54 size^f; 

55 Node n ■ new Node(v); 

56 if (size -■ 1) bottom ■ n; 

57 Join(n, top); 

58 top - n; 

59 return true; 

60 } 

61 

62 public int pop() { 

63 Node t ■ top; 

64 top - top.beloM ； 

65 size--; 

66 return t.value; 

67 > 

68 

69 public boolean isEmptyO { 

70 return size =« 0; 

71 } 

72 

73 public int removeBottonO { 

74 Node b = bottom; 

75 bottom = bottom.above; 

76 if (bottom != null) bottoa.below * null; 

77 size--; 

78 return b.value; 

79 > 

80 > 


这个问题在概念上并不是很难，但要完整实现需要编写大量代码。面试官一般不会要求你写 
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出全部代码 0 

解决这类问题，有个很好的策略，就是尽量将代码分离出来，写成独立的方法，比如 popAt 
可以调用的 leftShift 。 这样一来，你的代码就会更加清晰.而你在处理细节之前，也有机会先 
铺设好代码的骨架。 


3.4 在经典问题汉诺塔中，有3根柱子及/ V 个不同大小的穿孔圆盘，盘子可以薄入任意一 
根柱子。 一 fT 始，所有盘子自底向上从大到小依次套在第一根柱子上（即每一个盘子只能放在更 
大的盘子上面 )0 移动 ® 盘时有以下 限制： 

(1) 每次只能移动一个 盘子： 

(2) 盘子只能从柱子顶■出移到下一根柱子： 

(3) 盘子只能 粧比它 大的盘子上。 

请运用栈，编写程序将所有盘子从第一根柱子移到最 后一根 柱子。（第51页） 


解法 

这个问题看起来很适合采用基木案例构建法, 



我们先从最简单的例子《= 1开始。 

当 n = l 时，能否将盘子1从柱1移至柱3?回答是冉定的。 

直接将盘子1从柱1移至柱3。 

当》= 2时，能否将盘子1和盘子2从柱1移至柱3?可以。 

(1) 将盘子1从柱1移至柱2。 

(2) 将盘子2从柱1移至柱3。 

(3) 将盘子1从柱2移至柱3。 

注意，上述步骤将柱2用作缓冲区，在我们将其他盘子移至柱3时，柱2会暂存一个盘子。 

当《 = 3时，能否将盘子1、2、3从柱1移至柱3?可以。 

(1) 从上面可知，我们可以将上面的两个盘子从一根柱子移至另一根柱子，因此假定已经这 
么做了，只不过，这里是将这两个盘子移至柱2。 

(2) 将盘子3移至柱3。 

(3) 将盘子1、2移至柱3。重复步骤1即可。 

当 n = 4 时，能否将盘子1、2、3、4从柱1移至柱3?可以。 

(1) 将盘子1、2、3移至柱2。具体做法参见前面的例子。 

(2) 将盘子4移至柱3。 

(3) 将盘子1、2、3移至柱3。 



注意，柱2和柱3之间并无多大区別，只是叫法不一样，实则是等价的。把柱2作为缓冲，以 
将盘子移至柱3,相比把柱3用作缓冲，以将盘子移至柱2,并无区别。 

根据上述做法，很0然地就可以导出递归算法。在每一部分，我们都会执行以下步骤，用伪 
码简述 如下： 
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public void moveTopTo(Tower t) { 
int top = disks.pop(); 
t.add(top); 

System.out.println("Move disk _ ♦ top ♦ " from " + index() + 
"to ■ + t.index()); 


public void moveDisks(int n. Tower destination. Tower buffer) { 
if (n > 0 ) { 

moveDisks(n • 1, buffer, destination); 
moveTopTo(destination); 
buffer.moveDisks(n - 1, destination, this); 


严格来说，并不-•定要将柱子实现为独立的对象.不过，在某种程度 h , 这么做可使代码更 
沾晰鉍读。 


3.5 实现一个 MyQueue 类，该类用两个找来实 现一个 队列。（第 51 页） 

解法 

队列和找的主要区别在于元素进出顺序 （ 先进先出和后进先出），因此，我们萡要修改 peek (〉 
和 pop <), 以相反顺序执行操作。我们可以利用第二个栈反转元索的次序（弹 Hisl 的元索,压入 
S 2)。 在这种实现中，每当执行 peek () 和 P (3 p 0 操作时，就要将 si 的所有元素弹出，压人 s 2 中， 
然后执行 peek / pop 操作，冉将所有元素压人 si 。 

上述做法也是对行的，但若连续执行两次 pop / peek 操作，那么，所有元素都要移来移去，重 
复移动，这毫无必要。我们可以延迟元素的移动，即让元素一直留在 S 2 中，只有必须反转元素次 
序时才移动元素。 

在这种做法中， stackNewest 顶端为最新元素， stackoidest 顶端为最旧元索。在将一个元 
素出列时，我们希望先移除最旧元素， W 此先将元索从 stackoidest 将元素出列。若 stackoidest 
为空，则将 stackNewest 中的所有元素以相反的顺序转移到 stackoidest 中。如要插人元素，就 
将其压人 stackNewest , 因为最新元素位于它的顶端 c 

下面是该算法的实现代码。 

1 public class MyQueue<T> { 

2 Stack<T> stackNewest, stackoidest; 

3 

4 public MyQueue() { 

5 stackNewest = new Stack<T>(); 

6 stackoidest = new Stack<T>(); 


public int size() { 
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32 

33 


37 


return stackNewest.sizeO -*■ stackOldest.size(); 


public void add(T value) { 

/* 压入 stackNewest, 最新元索始终位于它 
* 的顶端 */ 

stackNewest.push(value) ; 


/* 将元素从 stackNewest 移 istackOldest, 这么做 遢常是 
* 为了要在 stackOldest 上执行操作 V 
private void shiftStacks() { 
if (stackOldest.isEnptyO) { 

while (1 stackNewest.isEnptyO) { 
stackOldest.push(stackNewest.pop(>); 


public T peek() { 

shiftStacks(); // 确保 stackOldest 含有当前元景 
return stackOldest.peek(); // 取回最旧元索 


public T remove() { 

shiftStacks(); // 碼保 stackOldest 含有当 iff 元索 
return stackOldest.pop(); // 焊出最旧元索 


在真正的面试中，你有可能记不清具体的 API 调用。真的碰到这种怡况时，也不必太紧张 
你可以问一些小细节，多数面试官都不会为难你。他们更关注你能杏做到通盘的理解问题 u 


3.6 编写程序.按升序对栈进行排序（即最大元素位于栈顶)。最多只能使 用一个 额外的 
栈存放临时数据，但不得将元素复制到别的数据结构中（如数组)。该找支持如下 操作： push 、 
pop、peek 和 isEmpty 。 （第 51 页） 

解法 

• 种做法是实现初步的排序算法 3 搜索整个栈，找出最小元素，之后将其压人另一个栈。然 
后，在剩余元素中找出最小的，并将其人找。这种做法实际上需要 个栈： si 为原先的找 ， S2 
为最终排好序的栈， S3 在搜索 si 时用作缓冲区。要在 si 中搜索最小值，我们需要弹出 si 的元素， 
将它们压人缓冲区 S3 。 

可惜，我们只能使用一个额外的找。有没有更好的做法？有。 

我们不需要反复搜索最小值，若要对 si 排序，可以从 si 逐一弹出元柰，然后按顺序插人 S2 
中。具体怎么做呢？ 

假设有如下两个栈，其中 s2 是 “ 排序的 ” ， si 则是未排 序的： 
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从 si 中弹出5时，我们需要在 s 2 中找个合适的位置插人这个数。在这个例子中，正确位置是 
在 s 2 元素3之上。怎样才能将5插人那个位置呢？我们可以先从 si 中弹出5,将其存放在临时变量 
中。然后，将12和8移至 si (从 S 2 中弹出这两个数，并将它们压人 si 中），然后将5压人 S 2。 

步明 I 步《2 步骤3 


51 

S2 

8 


12 

5 

10 

3 

7 

1 


si 

s2 


12 


8 

10 

3 

7 

1 


si 

s2 

8 


12 


10 

3 

7 

1 


tmp = 5 tmp ■ 5 tmp * -- 

注意，8和12仍在 si 中，这没关系！对于这两个数，我们可以像处理5那样重复相关步骤，每 
次弹出 si 栈顶元素，将其放人 S 2 中的合适位置。（当然，我们 SI 以将8和12直接从 S 2 移至 si , 因 
为这两个数都比5大，这些元素的“正确位罝”就是放在5之上。我们不需要打乱 S 2 的其他元素， 
当 tmp 为8或12时， 下曲代 码中的第二个 while 循环不会执行。） 


1 public static Stack<Integer > sort(Stack<Integer> s) { 

2 Stack<Integer> r - new Stack<Integer>(); 

3 while (Is.isEnptyO) { 

4 int tmp = s.pop(); // 少骤 1 

5 while (Ir.isEmptyO && r.peek() > t_p) { // 步朦 2 

6 s.push(r.popO); 

7 > 

8 r.push(tmp); // 步霹 3 



这个算法的时间复杂度为空间复杂度为 O ( A 0。 

如果允许使用的栈数量不限，我们可以实现修改版的 quicksort ^ mergesort 。 

对于 mergesort 解法，我们可以再创建两个找，并将这个栈分为两部分。我们会递归排序每个 
栈，然后将它们归并到一起并排好序.放回原来的栈中。注意.该解法要求每层递归都创建两个 
额外的栈。 

对于 quicksort 解法，我们会创建两个额外的栈，并根据基准元素 （pivot element ) 将这个栈 
分为两个找。这两个栈会进行递归排序，然后归并在一起，放回原来的栈中。与上一个解法一样， 
每层递归都会创建两个额外的栈 C 
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3.7 有家动物收容所只收容狗与猫，且严格遵守“先进先出”的原则。在收荞该收容所的 
动物时，收养人只能收养所有动物中“最老”（根据进入收容所的时间长短）的动物，或者，可 
以挑选猫或狗（同时必须收养此类动物中••最老”的)。换言之，收养人不能自由挑选想收养的 
对象。请创建适用于这个系统的数据结构，实现各种揉作方法.比如 enqueue 、 dequeueAny , 
dequeueDog 和 dequeueCat 等。允许使用 Java 内霣的 LinkedList 数据结构。（第51页） 


解法 

这个问题有多种不同的解法。比如，我们可以只维护一个队列。这么做的话， dequeueAny 
( 收养任意一种动物）实现起来很简单，但 dequeueDog ( 收养狗）和 dequeueCat ( 收养猫）就要 
迭代访问整个队列，才能找到第一只该被收养的狗或猫。这会增加整个解法的复杂度，降低执行 
效宇。 

另一种解法简单明了而又高效，只箔为狗和猫各自创建-个队列，然后将 两街放 进名为 
AnimalQueue 的包裹类，并且存储某种形式的时戳，以标记每只动物进人队列（即收容所）的时 
间。当调用 dequeueAny 时，奄肴狗队列和猫队列的首部，并返间“最老”的那一只。 

1 public abstract class Aninal { 

2 private int order; 

3 protected String name; 

4 public Animal(Strlng n) { 

5 name - n; 

6 > 

7 

8 public void setOrder(int ord) { 

9 order ■ ord; 

10 > 

11 

12 public int getOrder() { 

13 return order; 

14 } 

15 

16 public boolean isOlderThan(Animal a) { 

17 return this.order < a.getOrder(); 

18 > 

19 } 

20 

21 public class AnimalQueue { 

22 LinkedList<Dog> dogs = new LinkedList<Dog>(); 

23 LinkedList<Cat> cats » new LinkedList<Cat>(); 

24 private int order = 0; // 用作时戮 

25 

26 public void enqueue(Animal a) { 

27 /* order 用作采种形式的时戮 . 以便比较灼或猶 

28 * 祐入队列的先后順序 */ 

29 a.setOrder(order) ; 

30 order++; 

31 

32 if (a instanceof Dog) dogs.addLast((Dog) a); 

33 else if (a instanceof Cat) cats.addLast((Cat)a); 
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public Animal dequeueAny() { 

/* 壹看狗和供的队列的首部，弹出 
* 最旧的值 */ 

if (dogs.size() == 0) { 
return dequeueCats(); 

} else if (cats.size() «■ 0) { 
return dequeueDogs(); 


Dog dog - dogs.peek(); 

Cat cat ■ cats.peek(); 
if (dog.isOldcrThan(cat)) { 
return dequeueOogs(); 

> else { 

return dequeueCats(); 


public Dog dequeueDogs() { 
return dogs.poll(); 


public Cat dequeueCats() { 
return cats.poll(); 


! public class Dog extends 
I public Dog(String n 〉 
i super(n); 


I public class Cat extends Animal 
► public Cat(String n) { 

I super(n); 


9.4 树与图 


4.1 实现一个函数，检查二叉树是否平衡。在这个问题中.平衡树的定义如下：任窻一个 
结点，其两棵子树的高度差不超过1。（第54页） 


解法 

还算幸运，此题至少明确给出丫平衡树的 定义： 任意一个结点，其两棵子树的高度差不 
大于1。根据该定义可以得到一种解法，即直接递归访问整棵树，计算每个结点两棵子树的 
高度。 
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1 public static int getHeight(TreeNode root) { 

2 if (root =* null) retorn 0 ; // 终止条件 

3 return Math.max(getHeight(root.left), 

4 getHeight(root.right)) + 1; 

5 } 

6 

7 public static boolean isBalanced(TreeNode root) { 

8 if (root ■■ null) return true; // 终止条件 

9 

10 int heightDiff - getHeight(root.left) - getHeight(root.right); 

11 if (Math.abs(heightDiff) > 1) { 

12 return false; 

13 > else { // 速归 

14 return isBalanced(root.left) && isBalanced(root.right); 

15 > 

16 } 

虽然可行，但效丰不太离，这段代码会递归访问每个结点的整棵子树。也就是说 ， getHeight 
会被反复调用计算同一个结点的高度。因此 . 这个算法的时间复杂度为 0(AMogiV )。 

我们可以删减部分 getHeight 调用。 

仔细査看上面的方法，你或许会发现， getHeight 不仅可以检 # 高度，还能检査这棵树是否 
平衡。那么，我们发现子树不平衡时又该怎么做呢？直接返回 -1 。 

改进过的算法会从根结点递归向下检査每棵子树的高度。我们会通过 checkHeight 方法，以 
递归方式获取每个结点左右子树的高度。若子树是平衡的，则 checkHeight 返 冋该子 树的实际卨 
度。若子树不平衡 . 则 checkHeight 返回 -1„ checkHeight 会立即中断执行，并返回 -1 。 

下面是该算法的实现代码。 

1 public static int checkHeight(TreeMode root) { 

2 if (root ■■ null) { 

3 return 0; // 高度为 0 

4 > 

5 

6 /• 捡壹左子树是否乎衡 */ 

7 int leftHeight * checkHeight(root.left); 

8 if (leftHeight ■■ -1) { 

9 return -1 ； // 不平衡 

10 > 

11 /* 检查左子树是否平衡 */ 

12 int rightHeight * checkHeight(root.right); 

13 if (rightHeight =* -1) { 

14 return -1; // 不平衡 

15 > 

16 

17 /* 检查当莳结点是否平衡 V 

18 int heightDiff = leftHeight - rightHeight; 

19 if (Math.abs(heightDiff) > 1) { 

20 return -1; // 不平衡 

21 > else { 

22 /* 返田高度 */ 

23 return Math.aiax(leftHeight, rightHeight) 4 l; 

24 > 
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public static boolean isBalanced(TreeNode root) 
if (checkHeight(root) ■- -1) { 
return false; 


这段代码需要 O ( A 0 的时间和 0(//) 的空间，其中《为树的高度。 

4.2 给定有向图，设计_个算法.找出两个结点之间是否存在_条路径。（第54页） 


只需通过图的遍历，比如深度优先搜索或广度优先搜索等，就能解决这个问题。我们从两个 
结点的其中一个出发，在遍历过程中，检査是否找到另一个结点。在这个算法中，访问过的结点 
都应标记为“已访问”，以免循环和重复访问结点。 

下面是广度优先搜索的迭代 实现。 

1 public enum State { 

2 Unvisited, Visited, Visiting; 
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碰到这类问题时，很有必要跟面试官探讨一下广度优先搜索和深度优先搜索之间的利弊。例 
如， . 深度优先搜索实现起来比较简单，因为只需简单的递归即可。广度优先搜索很适合用来査找 
最短路径，而深度优先搜索在访问邻近结点之前，可能会先深度遍历其中一个邻近结点。 

4.3 给定一个有序整数数组，元素各不相同且按升序排列 . 编 写一个 算法， 创建一 棵高度 
最小的二叉查找树。（第 54 页） 


解法 

要创建一棵高度最小的树，就必须让左右子树的结点数量越接近越好。也就是说，我们要让 
数组中间的值成为根结点，这么一来 . 数组左边一半就成为左子树，右边一半成为右子树。 

然后， 我们继续以类似方式构造整棵树。数组每一区段的中间元素成为子树的根结点，左半 
部分成为左子树，右半部分成为右子树。 

一种实现方式是使用简单的 root.insertNode(int v) 方法，从根结点开始，以递归方式将 
值 v 插入树中。这么做的确能构造 M 小高度的树 . 但效率并不是太高。每次插入操作都要遍历整 
棵树，时间开销为 0(AHogAO 。 

另种做 法是以递归方式运用 createMinimalBST 方法，从而消除部分多余的遍历操作。这 
个方法会传人数组的一个区段，并返回最小树的根结点。 

该算法简述如下。 

(1) 将数组中间位置的元索插人树中。 

(2) 将数组 左十边 元素插人左子树。 

(3) 将数组右半边元素插人右子树。 

(4) 递归处理。 

下面是该算法的实现代码。 


TreeNode createMinimalBST(int arr[], int start, lnt end) { 
if (end < start) { 



int mid - (start ♦ end) / 2; 

TreeNode n = new TreeNode(arr[mid]); 

n.left = createMinlmalBST(arr, start, mid - 1); 

n.right * createMinimalBST(arr, mid * 1 , end); 



12 TreeNode createMinimalBST(int array[]) { 

13 return createMininalBST(array« 0, array.length - 1); 


尽管这段代码看起来不是特别复杂，但徉编写过程中很容易犯了差一错误 （ off-by^one )。 对 
这部分代码，务必进行详尽测试。 
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4.4 给定一棵二叉树.设计一个算法，创建含有某一深度上所有结点的链表（比如，若一 
棵树的深度为 D ,则会创建出 D 个链表 )„ ( 第54页） 

解法 

乍一看，你可能认为这个问题需要一层一层逐一遍历，但其实并无必要。你可以用任意方式 
遍历整棵树，只要记住结点位于囑一层即可。 

我们可以将前序遍历算法稍作修改，将 level + 1 传人下一个递归调用。下面是使用深度优 
先搜索的实现 代码。 

1 void createLevelLinkedList(TreeNode root, 

2 ArrayList<LinkedList<TreeNode>> lists, int level) { 

3 if (root ― null) return; // 终止条件 

4 

5 LinkedList<TreeNode> list ■ null; 

6 if (lists• size() ■■ level) { // 该展不在 tt 表中 

7 list = new LinkedList<TreeNode>(); 

8 /* 以中序遍历所有展級，因此.若这是豕一次 

9 * 访问第 i 层，《表示我们已访问过第 0 到 i-1 层 . 

10 * 因此，我们 T 以安全地将这一展加 到鍵表 

11 • 末端 • 

12 lists.add(llst); 

13 > else { 

14 list ■ lists.get(level); 

15 > 

16 list.add(root); 

17 createLevelLinkedList(root.left, lists, level ♦ 1); 

18 createLevelLinkedList(root.rights lists, level + 1); 

19 } 

20 

21 ArrayList<LinkedList<TreeNode>> createLevelLinkedList( 

22 TreeNode root) { 

23 ArrayList<LinkedList<TreeNode>> lists ■ 

24 new ArrayList<LlnkedLlst<TreeNode»(); 

25 createLevelLinkedList(root, lists, 0); 

26 return lists; 

27 } 

另•种做法是对广度优先搜索稍加修改，即从根结点开始迭代，然后第2层，第3层，等等。 
处于第;层时，则表明我们已访问过第 i - l 层的所有结点。也就是说，要得到/层的结点，只需 
直接査看/- I 层结点的所有子结点即可。 

下面是该算法的实现代码。 

1 ArrayList<LinkedList<TreeNode» createLevelLinkedList( 

2 TreeNode root) { 

3 ArrayList<LinkedList<TreeNode» result = 

4 new ArrayList<LinkedList<TreeNode»(); 

5 /* 访问根结点 */ 

6 LinkedList<TreeNode> current = new LinkedList<TreeNode>(); 

7 if (root != null) { 

8 current.add(root); 
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while (current.size() > 0) { 

result.add(current); // 加入上一层 
LinkedList<TreeNode> parents = current; 11 转釣下一屋 
current = new LinkedList<TreeNode>(); 
for (TreeNode parent : parents) { 

/* 访问子結点 * / 
if (parent.left !■ null) { 
current.add(parent.left); 

} 

if (parent.right !- null) { 
current.add(parent.right); 



你可能会问，这两种解法哪一种效率更高？两者的时间复杂度皆为 O ( A 0, 那么空间效率呢？ 
乍一看，我们可能会以为第二种解法的空间效率更高。 

在某种意义上，这么说也对^第一种解法会用到 O ( logA 0 次递归调用（在平衡树中），每次调 
用都会在找里增加一级。第二种解法采用迭代遍历法，不笛要这部分额外空间。 

不过，两种解法都要返回 0(^0 数据.因此，递归实现所需的额外 O ( logA 0 空间.跟必须传回 
的 O ( A 0 数据相比，并不算多。虽然第一种解法确实使用了较多的空间，但从大 Oi 己法的角度来看， 
两者效率是一样的。 


4.5 实现一个函数，检查一棵二叉树是否为二叉查找树。（第54页） 

解法 

此题有两种不同的解法。第一种是利用中序遍历，第二种则建立在 left <= current < right 
这项特性之上。 


解法1:中序遍历 

看到此题.闪过的第一个想法可能是中序遍历，将所有元素复制到数组中，然后检査该数组 
是否有序。这种解法要多用一点内存，大部分情况下都没问题。 

唯一的问题在于.它无法正确处理树中的重复值。例如，该算法无法区分下面这两棵树（其 
中一棵是无效的〉，因为两者的中序遍历结果相同。 

Valid BST [20.left - 20] 

Invalid BST [20.right = 20] 

不过，要是假定这棵树不得包含重复值，那么这种做法还是行之有效的。该方法的伪码大致 
如下： 

1 public static int index = d; 

2 public static void copyBST(TreeNode root, int[] array) { 

3 if (root == null) return; 
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copyBST(root.left, array); 
array[index] = root.data; 



copyBST(root.right, array); 


» public static boolean checkBST(TreeNode root) { 
int[] array = new lnt[root.size]; 
copyBST(root, array); 
for (int i ■ 1; i < array.length; i++) { 
if (array[i] <■ array[i - 1]) return false; 


I true; 


注意，这里必须记 泌数 组在逻辑上的“尾部”，用它来分配空间以储存所有元素。 

仔细审视这个解法，我们就会发现代码中的数组实无必要。除了用来比较某个元素和前个 
元素，别无他用。那么，为什么不在进行比较时，苴接记下最后的元素？ 

下面是该算法的实现代码。 


public static int last_printed - Integer.MIN_VALUE; 
public static boolean checkBST(TreeNode n) { 
if (n ■- null) return true; 


// 連知捡査左子树 

if (lcheckBST(n.left)) return false; 

// 检全当前场点 

if (n.data <■ last_printed) return false; 
last_printed ■ n.data; 

// 违归搶查右子树 

if (!checkBST(n.right)) return false; 
return true; // 全部检查完毕 


要是不喜欢使用静态变量，可以稍作修改，使用包裹类存放这个整数值，如下 所示: 


1 class Mraplnt { 

2 public int value; 

3 } 

或者，若用 C ++ 或其他支持按引用传值的语言实现，就可以这么做 


解法 2: 最小/最大法 

第二种解法利用的是二叉査找树的定义。 

一棵什么样的树才成其为二叉査找树？我们知道这棵树必须满足以下 条件： 对于每个结点, 
left.data <= current.data < right . data , 但是这样还不够。试看下面这棵小树： 
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尽管每个结点都比左子结点大，比右子结点小，但这 a 然不是一棵二叉査找树，其中25的位 
置不对。 

更准确地说，成为二叉査找树的条 件是： 所有左边的结点必须小于或等于当前结点，而当前 
结点必须小于所有右边的结点。 

利用这一点，我们可以通过自上而下传递最 小和® 大值来解决这个问题。在迭代遍历整个树 
的过程中，我们会用逐渐变窄的范围来检査各个结点。 

以下面这棵树 为例： 



首先，从 (min = INT . MIN , max = INT _ MAX ) 这个范闱开始，根结点 M 然落在其屮。然后处 
理左子树，检査这些结点是否落在 (min = INT . MIN , max = 20>范闱内。然后再处理（值为10 
的结点）右子树，检査结点是否落在 (min ■ 20, max ■ INT _ MAX ) 范围内。 

然后，继续依此遍历整棵树。进人左子树时，更新 max 。 进人右子树时，更新 min 。 只要有任 
一结点不能通过检査，则停止并返回 falsi 

这种解法的时间复杂度为 O(A0, 其中"为整棵树的结点数。我们可以证明这已经是最佳做法， 
因为任何算法都必须访问全 部况个 结点。 

因为用了递归，对于平衡树，空间复杂度为0(1% A % 在调用找上，共有 O ( l O gA 0 个递归调用， 
因为递归的深度最大会到这棵树的深度。 

该解法的递归实现代码 如下： 


boolean checkBST(TreeNode n) { 
return checkBST(n, Integer.M 


N_VALUE, Integer.MAX_VALUE); 


boolean checkBST(TreeNode i 
if (n == null) { 
return true; 


: «iin, int max) 
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if (n.data < min | | n.data >= max) { 
return false; 


if (!checkBST(n.left, nin, n.data) || 
!checkBST(n.right, n.data, max)) { 
return false; 

> 

return true; 


记住，在递归算法中，一定要确定终止条件以及结点为空的情况得到妥善处理。 


4.6 设 计一个 算法.找出二叉查找树中指定结点的“下一个”结点（也即中序后继)。可 
以假定每个结点都含有指向父结点的 连接。 （第54页） 


解法 

回想一下中序遍历，它会遍历左子树，然后是当前结点 . 接着是右子树。要解决这个问题 . 
必须非常小心，想想具体是怎么回事。 

假定我们有 • 个假想的结点。我们知道访问顺序为左子树，当前结点，然后是右了 • 树。显然， 
下一个结点应该位于右边。 

不过，到底是右子树的哪个结点呢？如果中序遍历石子树，那它就会是接下来第一个被访问 
的结点，也就是说，它应该是右子树最左边的结点。够简单吧！ 

但是，若这个结点没有右子树，又该怎么办？这种情况就有点棘手了。 

若结点 n 没有右子树，那就表示已遍访 n 的子树。我们必须回到 n 的父结点， C 作 q 。 

若 n 在 q 的左边，那么，下一个我们应该访问的结点就是 q ( 中序遍历 ， left -> current -> 
right ) 0 

若 n 在 q 的右边，则表示已遍访 q 的子树。我们需要从 q 往上访问，直至找到我们还未完全遍访 
过的结点 X 。怎么才能知道还未完全遍历结点 X 呢？之前从左结点访问至其父结点时，就已碰到了 
这种情况。左结点已完全遍历，但其父结点尚未完全遍历。 

伪码 如下： 

1 Node inorderSucc(Node n) { 

2 if (n has a right subtree) { 

3 return leftmost child of right subtree 

4 } else { 

5 while (n is a right child of n.parent) { 

6 n ■ n.parent; // 往上 

7 . > 

8 return n.parent; // 父結点还表 遍历 

9 } 

10 > 

且慢，如果一路往上遍访这棵树都没发现左结点呢？只有当我们遇到中序遍历的最末端时， 
才会出现这种情况 c 也就是说，如果我们已位于树的最右边，那就不会再有中序后继，此时该返 
回 null 。 
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下面是该算法的实现代码 （ 已正确处理结点为空的情况)。 


public TreeNode inorderSucc(TreeNode n) 
if (n ■- null) return null; 

/* 找到右子結点， « 返 W 右子树里 
* 最左边的結点 */ 
if (n.right !■ null) 
return leftMostChild(n.right); 

> else { 

TreeNode q ■ n; 

TreeNode x » q.parent; 

// 向上直至位于左边而不是右边 
while (x !■ null && x.left !■ q) { 
q ■ x; 

x * x.parent; 


I public TreeNode leftHostChild(TreeNode n) 
if (n ― null) { 
return null; 


* (n.left 
: n.left; 


« null) 


这不是世上最复杂的算法问题，但要写出完美无瑕的代码却有难度。由对这类问题，比较实 
用的做法是用伪码勾勒大纲 . 仔细描绘各种不同的情况。 

4.7 设计并实现一个算法，找出二叉树中某两个结点的第一个共同祖先。不得将额结 
点储存在另外的数据结构中。 注意： 这不一定是二叉查找树。（第54页〉 


解法 

如果是二叉査找树，我们可以修改 find 操作，用来査找这两个结点，看看路径在哪里开始分 
叉。可惜，这不是二叉査找树，因此必须另觅他法。 

下面假定我们要找出结点 p 和 q 的共同祖先。在此先要问个问题，这棵树的结点是否包含指向 
父结点的连接。 

解法1:包含指向父结点的连接 

如果每个结点都包含指向父结点的连接，我们就可以向上追踪 p 和 q 的路径，直至两者相交。 
不过，这么做可能不符合题目的若干假设，因为它需要满足以下两个条件 之一： （ 1 >可将结点标 
记为 isVisited; (2) 可用另外的数据结构如散列表储存一些数据。 
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解法2:不包含指向父结点的连接 

另一种做法是，顺着一条 p 和 q 都在同一边的链子，也就是说，若 p 和 q 都在某结点的左边，就 
到左子树中査找共同祖先。若都在右边，则在右子树中査找共同祖先。要是 p 和 q 不在同一边，那 
就表示已经找到第一个共同祖先。 

这种做法的实现代码如下。 


/* 若 p 为 root 的子孙，則逆回 true •/ 
boolean covers(TreeNode root, TreeNode p) { 
if (root null) return false; 
if (root ■- p) return true; 

return covers(root.left, p) || covers(root.right, p); 


TreeNode conmonAncestorHelper(TreeNode root, TreeNode p, 
TreeNode q) { 

if (root — null) return null; 

if (root ■■ p 11 root ■- q) return root; 

boolean is_p_on_lcft - covers(root.left, p); 
boolean is_q_on_left ■ covers(root.left, q); 


23 


/• 若 p 和 q 不在 W — 边，則返印 root •/ 
if (is_p_on_left !- is_q_on_left) return root; 

/* 否则就是在用 一边，遍访厣一边 •/ 

TreeNode child_slde * is_p_on_left ? root.left : root.right; 
return comnonAncestorHelper(child_side 4 p, q); 


24 TreeNode conmonAncestor(TreeNode root, TreeNode p, TreeNode q) { 

25 if (! covers (root, p) || lcovers(root, q)) { // 锤设後查 

26 return null; 

27 > 

28 return conmonAncestorHelper(root, p, q); 



这个算法在平衡树上的运行时间为 0( n )。 这是因为第一次调用时， covers 会在2/»个结点上调 
用（左边 / rt 结点，右边 / rt 结点)。接着，该算法会访问左子树或右子树，此时 covers 会在2«/2 
个结点上调用，然后是2«/4,依此类推。最终的运行时间为0(/0。 

至此，就渐近式运行时间 （ asymptoticruntime ) 来看，可以确定没有更优解了，因为必须遍 
访这棵树的每一个结点才行。不过，或许我们还能减小常数倍的值。 


解法3:最优化 

尽管解法2在运行时间上已经做到最优，还是可以看出部分低效的操作。特别是， covers 会 
搜索 root 下的所有结点以査找 p 和 q , 包括每棵子树中的结点 （ root . left 和 root.right )。然后， 
它会选择那些子树中的一棵，搜遍它的所有结点。毎棵子树都会被一再地反复捜索。 

你可能会觉察到，只需搜索一遍整棵树，就能找到 p 和 q 。 然后，就可以“往上冒泡”在找里 
找到先前的结点。基本逻辑与上一种解法 相同。 
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使用函数 commonAncestor(TreeNode root , TreeNode p , TreeNode q ) 递归访问整棵树， 
这个函数的返回值 如下： 

□返回 P ， 若 root 的子树含有 p (而非 q ); 

口返回 q ， 若 root 的子树含有 q (而非 p ); 

□ 返回 null , 若 p 和 q 都不在 root 的子树中； 

□ 否则，返回 p 和 q 的共同祖先。 

在最后一种情况下，要找到 P 和 q 的共同祖先比较简单。 

* commonAncestor ( n . right , p , q ) 都返回非空的值时（意即 p 和 q 位于不同的子树中），则 nBP 
为共同祖先。 

下面的代码提供了初步的解法，不过其中有个 bug 。 试着找找看。 

1 /* 下 * 的代玛有个 bug V 

2 TreeNode conwonAncestorBad(TreeNode root, TreeNode p, TreeNode q) { 

3 if (root ■* null) { 

4 return null; 

5 > 

6 if (root » p && root *■ q) { 

7 return root; 

8 > 

9 

10 TreeNode x = coamonAncestorBad(root.left, p, q); 

11 if (x !- null M x ■■ p x 窗 ■ q) { // 已轻找列父系蛣点 

12 return x; 

13 } 

14 

15 TreeNode y = commonAncestorBad(root.right, p, q); 

16 if (y I- null M. y I- p && y !« q) { // 已轻找到父系点 

17 return y; 

18 } 

19 

20 if (x |a null M y I 囂 null) { // 在不円子辑里找利 p 和 q 

21 return root; // 这是共两杻先 

22 > else if (root ■■ p || root *= q) { 

23 return root; 

24 > else { 

25 /• x 或 y 有一个非空，則返田胙空的那个值 •/ 

26 return x ** null ? y : x; 

27 > 

28 } 

假如有个 结点不 在这棵树中，这段代码就会出问题。例如，请看下面这 棵树： 
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假设我们调用 commonAncestor(node 3, node 5, node 7)。当然，结点7并不存在，而这 
正是问题的源头。调用序列 如下： 

1 commonAncestor(node 3, node 5, node 7) // --> 5 

2 calls commonAncestor(node 1, node 5, node 7) // --> null 

3 calls commonAncestor(node 5^ node 5 ， node 7) // --> 5 

4 calls conmonAncestor(node 8, node 5, node 7) // --> null 

换句话说，对右子树调用 commonAncestor 时，前面的代码会返回结点5,这也符合代码本意。 
问题在于査找 P 和 q 的共同祖先时，调用函数无法区分下面两种情况。 

□情况 I : p 是 q 的子结点（或相反， q 为 p 的子结点)。 

□情况2: p 在这棵树中，而 q 不在这棵树中（或者相反)。 

不论哪种情况， commonAncestor 都将返 Mp 。 对于情况1,这是正确的返回值，而对于情况2, 
返回值应该为 null 。 

我们需要设法区分这两种情况，这也是以下代码所做的。这段代码的做法是返回两个 值：结 
点自身，以及指示这个结点是否确为共同祖先的标记。 

1 public static class Result { 

2 public TreeNode node; 

3 public boolean isAncestor; 

4 public Result(TreeNode n, boolean isAnc) { 

5 node - n; 

6 isAncestor ■ isAnc; 

7 > 

8 > 

9 

10 Result comnonAncestorHelper(TreeNode root, TreeNode p, TreeNode q){ 

11 if (root — null) { 

12 return new Result(null, false); 

13 } 

14 if (root ■■ p && root *= q) { 

15 return new Result(root, true); 

16 > 

17 

18 Result rx * comnonAncestorHelper(root.left, p, q); 

19 if (rx.isAncestor) { // 找到共岡祖先 

20 return px; 

21 } 

22 

23 Result ry ■ comnonAncestorHelper(root.right , p t q); 

24 if (ry.isAncestor) { // 找到共同祖先 

25 return ry; 

26 } 

27 

28 if (rx.node != null && ry.node != null) { 

29 return new Result (root, true); // 这是共同祖先 

30 > else if (root == p || root == q) { 

31 /* 若我们当前位于 p 或 q ， 并发現其中一仑蛄点 

32 * 位于子树中，那么这真的軋是一 个共两 祖先， 

33 * 标记应该设为 true。 ♦/ 
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true : false; 

I Result(root, isAncestor); 


y.node, false); 


: TreeNode comnonAncestor(TreeNode root, TreeNode | 
I Result r ■ comnonAncestorHelper(root J p, q); 

^ if (r.isAncestor) { 
return r.node; 


TreeNode q) 


当然，由于这个问題只会在 p 或 q 并不属于这棵树的情况下出现.另一种避免 bug 的做法是先 
搜遍整棵树，以确保两个结点都在树中。 


4.8 你有两棵非常大的二叉树： T 1, 有几百万个结点： T 2. 有几百个结点。设计一个算 
法，判断 T 2 是否为 T 1 的子树。 

如果丁 1有这 么一个 结点…其子树与 T 2 —模一样. 则 T 2 为 T 1 的子树。也就是说，从结 
点 n 处把树砍断，得到的树与 T 2 完全相同。（第54页） 

解法 

碰到类似的问题，不妨假设只有少世的数据，以此为基础解决问题。这么做很冇用，可以借 
此找出可行的基本解法。 

在规模较小且较简单的问题中，我们可以创建一个宇符串，表示中序和前序遍历。若 T 2 
前序遍历是 T 1 前序遍历的子串，并且 T 2 中序遍历是 T 1 中序遍历的子串，则 T 2 为 TI 的子树。利 
用后缀树可以在线性时间内检査是否为子串，因此就最差情况的时间复杂度而言，这个算法是 
相当高效的。 

注意，我们需要在字符串中插人特殊字符，表示左结点或右结点为 NULL 的情况。否则，我们 
就无法区分以下两种 情况： 



尽管这两棵树不同，但两者的中序和前序遍历完全一样。 


中序 

3, 

3 

前序 

b 

3 

中序 

3, 

3 

前序 

3, 

3 


不过，要是标记出 NULL 值，就能区分这两 棵树: 
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T1 . 中序 
T1 , 前序 
T2 . 中序 
T2 , 前净 


对于简单的情形.这种解法还算不错，但是我们真正要面对的问题涉及的数据最要大得多。 
鉴于该问题指定的约束条件，创建两棵树的副本可能要占用太多的内存。 

另一种解法 

另一种解法是搜遍较大的那棵树 T 1。 每当 T 1 的某个结点与 T 2 的根结点匹配时，就调用 
treeMatcho treeMatch 方法会比较两棵子树，检査两者是否相同。 

分析运行时间有点复杂，粗略-看的答案可能是其中《为丁1的结点数， m 为 T 2 的结点 
数。虽然在技术上这个答案是正确的，但稍微再想想就能得到更靠谱的答案。 

我们不必对 T 2 的每个结点调用 treeMatch , 而是会调用 A 次，其中 A 为 T 2 根结点在 T 1 中出现的 
次数 n 因此运行时间接近 0(/1 + 加)。 

其实，即使这样运行时间也有所夸大。即使根结点相同，一旦发现 T 1 和 T 2 有结点不同 ，我 
们就会退出 treeMatch 。 因此，每次调用 treeMatch , 也不见得都会査看 m 个结点。 

下面是该算法的实现代码。 


boolean containsTree(TreeNode tl, 
if (t2 ■■ null) 
return true; 


TreeNode t2) 

// 空树一定是子树 


I subTree(tl, t2); 


boolean subTree(TreeNode rl, TreeNode r2) { 
if (rl — null) { 

' return false; // 大的树已炫空了，还本找子树 
> 

if (rl.data »= r 2 .data) { 
if (*atchTree(rl,r 2 )) return true; 

> 

return (subTree(rl.left, r 2 ) || subTree(rl.right , r 2 )); 


! boolean matchTree(TreeNode rl, TreeNode r2) { 
if (r2 ■■ null && rl ** null) // 若兩者郗空 
return true; // 子 树中己 无姑点 

// 若其中之一为空， 俚并不 W 对为空 
if (rl == null 11 r 2 ■» null) { 
return false; 


(rl.data != r 2 .data) 
return false; // 结点数据不匹 fc 
turn (matchTree(rl.left, r2.1eft) & 
matchTree(rl.right, r2.right)); 


3 , 0 , 3 , 0 , 
0 0 0 3 
3 , 3 > 3 , 0 , 
> J J > 
0 3 0 3 
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什么情况下用简单解法比较好，什么时候另一种解法比较好呢？这个问题值得跟面试官好好 
讨论一番，下面是几点注意事项。 

(1) 简单解法会占用+ 内存，而另一种解法则占用 OOog ⑻+ logOn )) 内存。 记住： 要求 
可扩展性时，内存使用多寡关系重大。 

(2) 简单解法的时间复杂度为 + 另一种解法在最差情况下的执行时间为 0(» m )。 话说 

回来，只看最差情况的时间复杂度可能会造成误导，我们需要做进一步观察。 

(3) 如前所述，比较准的运行时间为+ fen ), 其中 it 为 T 2 根结点在 T 1 中出现的次数 u 假设 
TI 和 T 2 的结点数据为0和 p 之间的随机数，则植大约为《//»,为什么？因为11有《个结点，每个结 
点有1//>的几率与 T 2 根结点相同，因此， T 1 中大约有结点等于 T 2 根结点 （ T 2. root )。 举个 
例子，假设 p = 1000. n = 1 000 000 H .« = 100。我们需要检査的结 点数世 大致为1 100 000 (1 
lee 000 = 1 000 000 + 100*1 eee 000/1000 )„ 

(4) 借助更复杂的数学运算和假设.就能得到更准确的运行时间。在第3点中，我们假设调 
用 treeMatch 时将遍历 T 2 的全部 m 个结点。然而，更有珂能出现的情况是，我们很早就发现两棵 
树有不同的结点，然后提早就退出了这个函数 „ 

总的来说，在空间使用上.另一种解法显然比较好，在时间复杂度上.也可能比简申解法更 
优。一切都取决于你做出哪些假设，以及要不要考虑牺牲最龙情况的运行时间，来减少平均情况 
的运行时间。这一点非常值得向面试官提出并讨论。 

4.9 给定 一棵二 叉树.其中毎个结点都含 有一个 数值。设计一个籌法.打印结点数值总和 
等于某个给定值的所有路径 。注意 .路径不一定非得从二叉树的根结点或叶结点幵始或结束 o ( 第 
54页） 

解法 

下面我们运用简化推广法来解題。 

部分1:简化——假设路径必须从根结点开始，但可以在任意结点结束，怎么解决？ 

在这种情况下，问题就会变得容易很多。 

我们可以从根结点开始，向左向右访问子结点，计算每条路径上到当前结点为止的数值总和， 
若与给定值相同则打印当前路径。注意.就算找到总和，仍要继续访问这条路径。为什么？ W 为 
这条路径可能继续往下经过 a + 1结点和 a - 1结点 （ 或其他数值总和为0的结点序列），完整路 
径的总和仍然等于 sum 。 

例如，若 sum = 5,可能会得到以下 路径： 

□ p = {2, 3} 

□ q = {2, 3, -A, -2, 6} 

如果找到2 + 3就停下来，我们就会错过第二条路径，还可能错过其他路径。因此，我们必 
须继续往下查找所有可能的路径。 
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部分2:推广——路径可从任意结点开始。 

现在，如果路径可从任意结点开始，该怎么办？在这种情况下，我们可以稍作调整。对于每 
个结点，我们都会向“上”检査是否得到相符的总和。也就是说.我们不再要求“从这个结点开 
始是否会有总和为给定值的路径”，而是关注“这个结点是否为总和为给定值的某条路径的末端”。 

递归访问每个结点 n 时，我们会将 root 到 n 的完整路径传人该函数。随后，这个函数会以相反 
的顺序，从 n 到 root, 将路径上的结点值加起来。当每条子路径的总和等 Tsum 时，就打印这条 
路径。 

1 public void findSum(TreeNode node, int sum, int[] path, int level) { 

2 if (node ■囂 null) { 

3 return; 

4 } 

5 

6 /* 将当莳熗点福入路径 V 

7 path[level] - node.data; 

8 

9 /* 查找以此为 终点丑 总和为 sum 的路径 •/ 

10 int t = 0 ; 

11 for (int i - level; i >- 0; i--){ 

12 t +■ path[i]; 

13 if (t — sun) { 

14 print(path, i, level); 

15 } 

16 > 

17 

18 /* 壹找此熗点之下的坫点 */ 

19 findSum(node.left, sum, path, level ♦ 1>; 

20 findSum(node.right, sum, path, level + 1); 

21 

22 /* 从路径中移陳当前点 . 严格来说并不一定要这么做， 

23 * 直接忽略这个值即 T, 钽这么做是个好习慣 •/ 

24 path[level 】 ■ Integer.MIN VALUE; 

25 > 

26 

27 public void findSum(TreeNode node, int sum) { 

28 int depth » depth(node); 

29 int[] path = new int[depth]; 

30 findSum(node, sum, path, 0); 

31 > 

32 

33 public static void print(int[] path, int start, int end) { 

34 for (int i = start; i <* end; 1++) { 

35 Systen.out.print(path[i] 4 - " w ); 

36 } 

37 System.out.println(); 

38 > 

39 

40 public int depth(TreeNode node) { 

41 if (node == null) { 

42 return 0; 

43 > else { 



return 1 + Math.max(depth(node.left), depth(node.right)); 


9.5 位操作 163 


那么，这个算法的时间复杂度如何（假设是棵平衡二叉树）？如果结点在 r 层，那么就需要 r 
份量的工作（向“上”检査结点的步骤)。我们可以猜测时间复杂度为 0(/1 log ( M )), 因为总共有 n 
个结点，平均下来，每一步需要 log (/ i ) 的工作最。 

如果这么分析，你还是看不大明 14. 我们也可以用严格的数学推导来说明。注意，在 r 层上 
有2,个结点。 

1 *2 l + 2 * 2 2 + 3 * 2 3 + 4 * 2 4 + — </*2 rf 
= sum(r * 2 r , r from 0 to depth ) 

= 2*(d-\)*2 J +2 
n = 2 d 


d = log («) 

注意， l ^^ x , 因此， 

0(2* ( log ⑻- l )*2 lo * < " , + 2) 

= 0(2 (log n - 1) * n ) 

= 0 (n log ⑻） 

按照同样的逻辑，可以推导出算法的空间复杂度为 O 0 og (/ i )), W 为该算法会递归 O ( l O g /0 次， 
而在递归调用中参数 path 只分配一次空间 （ 大小为 0( logn ))。 

9.5 位操作 

5.1 给定两个32位的整数 W 与 M, 以及表示比特位置的/与 y。 编写一个方法，将 M 插入 
N . 使得 M 从 A/ 的第 y 位幵始.到第/位结束。假定从_/位到/位足以容纳 M. 也 BDS/W=10011 ,那 
么7 和 /之间至少可容纳5个位。例如，不可能出现 ）= 3 和/ = 2的镯况.因为第3位和第2位之间 
放不下 M。 

神嘛 入 ： N = 10000000000, M = 10011,/ = 2 ,y = 6^： N = 10001001100 ( 第56页） 

解法 

这个问题的解决可分为三大步骤。 

(1) 将从/到《 之 间的位清零。 

(2) 对 A / Jk 行移位操作，与/和《‘之间的位对齐。 

(3) 合并 M 与 N 。 

其中步骤1最为棘手。如何将 W 中的那些位清零呢？我们可以利用掩码来清零。除/•到 I •之间的 
位为0外，这个掩码的其余位均为1。我们会先创建掩码的左半部分，然后是右半部分，最终得到 
整个掩码。 

1 int updateBits(int n, int m, int i, int j) { 

2 I * 创建掩码，用来清除 n 中 i 到 j 的位 
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3 /•示 例： i » 2, j = 4。掩码为 11100011. 

4 * 为 ft 单起见，本例掩码只有 8<i 

5 V 

6 int allOnes = ~0; // 等同于一连事的1 

7 

8 //在位置 j 之前的位均为1,其余为0, left = 11100000 

9 int left ■ allOnes << (j + 1); 

10 

11 // 在位置 i 之后的位均为 1, right = 00000011 

12 int right » ((1 « i) - 1); 

13 

14 // 涂 i 到 j 的位为 e, 其余位均为 i. mask = nieeeii 

15 int mask = left | right; 

16 

17 /• 清陳位置 j 到 i 的位.然后将 n 放进去 */ 

18 int n^cleared ■ n & mask; // 清味 jJli 的位 

19 int «_shifted • _ << i; // 将爾移 至相应的位篁 

20 

21 return n_cleared | n_5hifted; // 对两者执行位或操作，編定！ 

22 } 

解决这类问题时（包括许多位操作问 题)， 务必切实充分地对代码进行测试。否则，一不小 
心就容易犯下差一错误。 

5.2 给定一个介于0和1之间的实数（如 0.72), 类型为 double. 打印它的二进制 表示。 
如果该数字无法精确地用32位以内的二进制表示.则打印 “ERROR” 。（第 56页） 

解法 

注意，为表示淸晰起见，这里分別用 d l(1 来指示X是二进制还是十进制。 

首先，我们要弄清楚非整型的数字用二进制表示是什么样的。与十进制数相仿，二进制数 
0.10U 表示 如下： 

0 . 101 2 = 1 *( 1 / 2 ') + 0 *( 1 / 2 2 )+ 1 * ( 1 / 2 } ) 

为了打印小数部分，我们可以将这个数乘以2,检査2«是否大于或等于1。这实质上等同于“移 
动”小数部分， 也即： 
r = 2 l0 *« 

= 2 io * 0 . 101 2 

= 1 *( 1 / 2 °) + 0 *( 1 / 2 ')+ 1 *( 1 / 2 2 ) 

=1.01 2 

若 r >= 1，可知; * 的小数点后面正好有个1。不断*复上述步骤，我们可以检査每个数位。 

1 public static String printBinary(double nun) { 

2 if (num >■ 1 11 num <» 0 ) { 

3 return w ERR0R M ; 

4 > 

5 

6 StringBuilder binary = new StringBuilder(); 

7 binary.append( w .*); 

8 while (num > 0 ) { 
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9 /* 设定长度 上限： 32 个字符 */ 

.10 if (binary.length() >= 32) { 

11 return “ERROR ”； 

12 > 

13 

14 double r = nun * 2; 

15 if (r >= 1) { 

16 binary.append( 1 ); 

17 num = r - 1; 

18 > else { 

19 binary.append(0); 

20 num - r; 

21 } 

22 > 

23 return binary.toString(); 

24 } 

上面的做法是将数字乘以 2, 然后与1进行比较.此外我们还可以将这个数与 0.5 比较，然后 
与 0.25 比较，依此类推。卜面的代码示范了这一做法。 

1 public static String printBinary2(double num) { 

2 if (num >a l 11 nun <- 0 ) { 

3 return "ERROR"; 

4 } 

StringBuilder binary = new StringBuilder(); 
double frac ■ 0.5; 
binary.append 
while (num > 0) { 

/* 设定长度上限： 32 个字符 */ 
if (binary.length() > 32) { 
return M ERR0R M ; 

> 

if (num >■ frac) { 
binary.append(l); 
num -■ frac; 

> else { 

binary.append(0); 

> 

frac / = 2 ; 

> 

return binary.toString(); 

这两种做法都很 不错； 具体怎么做，就看你个人觉得哪种做法更自然。 

不论采用哪种方式，对于这类问题，一定要准备奸详尽的测试用例，并在面试中切实进行测试。 

5.3 给定一个正整数，找出与其二进制表示中1的个数相同、且大小最接近的那两个数 
(—个略大， 一个 略小)。（第56页） 

解法 

这个问题有多种解法，包括蛮力法、位操作以及巧妙运用算术。注意，运用算术法建立在位 


6 

7 

8 

9 

10 
11 
12 

13 

14 

15 
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19 
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22 

23 } 
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操作的解法之上。在介绍算术方法之前，你应该先学会位操作的解法。 

1. 蛮力法 

简单的做法就是直接使用 蛮力： 在 n 的二进制表示中，数出1的个数，然后增加或减小，直至 
找到1的个数相同的数字。简单吧，但也没什么意思。还有没有更优的做法呢？当然有！ 

下面先从 getNext 的代码开始，然后是 getPrev 。 


2.位操 作法： 取得后一个较大的数 

要是你还在考虑后一个数应该是什么样的，不妨作如下观察。以数字13948为例，二进制表 
示如下： 



我们想让这个数大一点（但又不会太大)，同时1的个数又要保持想不变。 

你会 发现： 给定一个数《和两个位的位 置/和 /, 假设将位 I 从 1 翻转为0,位/从0翮转成 1 。 若1> 
j , n 就会 减小； 若 /<_/. 则/!就会变大。 

继而得到以下几点。 

(0 若将某个0翻转成1,就必须将某个1翻转为0。 

(2) 进行位翻转时.如果0变1的位处于1变0的位的左边，这个数宇就会变大。 

(3) 我们想让这个数变大，但又不致太大。因此，必须翮转最右边的0,且它的右边必须还有个1。 
换句话说，我们要翻转右边但非拖尾的0。用上面的例子来说，拖尾0位于第0到第1个位置。 

因此，最右边但不是拖 M 的0处在位置7。我们把这个位置记作 p 。 

• 步骒1:翻转最右边、非拖尾的0 



将位置7翻转后，《就会变大。但是，现在/»中的1多了一个，0少了一个。我们还需尽量缩小 
数值，同时记得满足要求。 

缩小数值时，可以重新排列位 p 右方的那些位，其中，0放到左边，1放到右边。在重新排列 
的过程中，还要将其中一个1改为0。 

有种相对简单的做法是，数出 p 右方有几个1,将位置0到位置 p 的所有位清零，然后回填 cl -1 
个1。假设 cl 为 p 右方 1 的个数， C0 为 p 右方 0 的个数。 

下面举例说明这些操作。 

• 步 *2: 将 p 右方的所有位清零，由步#1可知， C0 = 2, cl = 5, p = 7 
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夫了将这些位清零，需要创建一个掩码，前面是一连串的1,后面跟着 p 个0,做法 如下: 

a = 1 « p; // 除位 p 为 1 外，其余位均为 0 
b = a - 1; // 前面全为 0 ，后面根 p 个 1 

mask = *^b; // 前面全为 1, 后面根 p 个 0 

n = n & mask; // 将右边 p 个位清零 

或者，更简洁的做法是： 

n &= -((1 « p) - 1 )； 

• 步骒 3: 回填 cl - 1 个 1 


1 1 0 1 1 1 0 10001111 

13 12 11 10 9 8 76543210 


要在 P 右边插人 Cl - 1个1,做法 如下： 

a - 1 « (d - 1 ); // 位 cl • 1 为 1 , 其余位均为 e 
b - a - 1; // 位 0 釗位 cl • 1 的位为 1, 其余位均为 0 

n - n | b; // 在位 e 刻位 cl • 1 处接入 1 

或者，吏简洁 一点： 
n |- (1 « (cl - 1 )) - 1 ; 

至此，我们得到大于/ I 的数字中，1的个数与的相 N 的最小数字。 
getNext 的实现代码 如下： 

1 public int getNext(int n) { 

2 /• 计算 c0 和 cl •/ 

3 int c ■ n; 

4 int c0 - 0; 

5 int cl ■ 0; 

6 while (((c & 1 ) — 0 ) && (c !- 0 )) { 

7 C0++; 

8 c >>■ 1 ; 

9 > 

10 

11 while ((c ft 1) ― 1 ) { 

12 d++; 

13 c »■ 1; 

14 > 

15 

16 /* 错 误：若 n ■■ 11.. 1100... 00, ip 么就没有更大的数字 • 

17 * 的个数相同 V 

18 if (c0 + cl ■■ 31 11 C0 + cl ― 0) { 

19 return -1; 

20 > 

21 

22 int p = c 0 + cl; // 最右边、非拖見 0 的位置 

23 

24 n |. (1 « p); // 舳转最 右边、非拖尾 0 

25 n &= -((1 « p) - 1); // 将 p 右方的所有位清零 

26 n |- (1 « (cl - 1 )) - 1 ; // 在 :& 方插入 （ cl- 1 ) 个 1 
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3. 位操 作法： 获取前一个较小的数 
getPrev 的实现方法与 getNext 的非常相似。 

(1) 计算 C 0 和 cl 。 注意 cl 是拖尾1的个数，而 C 0 为紧邻拖尾1的左方一连串0的个数。 

(2) 将最右边、非拖尾1变为0,其位置为 p = cl + C0 。 

(3) 将位 p 右边的所有位清零。 

(4) 在紧邻位置 p 的右方，插人 cl + 1个1。 

注意，步骤 M 位 p 淸零，而步骤3将位0到位 p -1 淸零，我们可以将这两步合并。 
下面举例说明各个步骤。 

• 步驟 1: 初始教字， p = 7, cl = 2, C 0 = 5 



• 步驟2、3:将位0到位 p 清零 


1 

e 

e 

1 

l | l 1 e 

V[ 0 l 

e 

0 

0 

0 

0 

- 

12 

LiL 

10 

9 : 7 

6 1 5 

4 

3 

2 

1 

e 


具体做法如下 所示： 

int a - 〆 /所有位 XI 

int b = a « (p + 1 ); // 位 p 左方的所 有位为 1 . 后 fllp+l 个 0 

n &= b ; // 将位 e 到位 p 清本 

• 步骤 4: 在紧邻位置 p 的右方，插入 cl + 1个1 



注意 ， p = cl + C 0. 因此 (cl + 1>个1的后面会跟 ( c 0 - 1>个0, 

int a - 1 « (cl + 1); // 位 （cl + 1)*1 . 其余 位均为0 
int b = a - 1; // 前 ® 为 0, 后 * *cl ♦ 1 个 1 

int c = b << (c0 - 1); // cl+1 个 1 ，后面个 0 
n |= c; 

getPrev 的实现代码如下所示。 

1 int getPrev(int n) { 

2 int temp = n; 

3 int c0 = 0; 

4 int cl « 0; 

5 while (temp & 1 == 1) { 

6 d++; 

7 temp »= 1; 
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8 } 

9 

10 if (temp == 0 ) return -1; 

11 

12 while (((temp & 1 ) == 0 ) && (temp != 0 )) { 

13 c0++; 

14 tenp >>= 1; 

15 > 

16 

17 int p » c0 + cl; // 最右边、非拖足 1 的位罝 

18 n &= ((-0) « (P + D )； // 将位 0 到位 p 清零 

19 

20 int mask » (1 « (cl + 1)) - 1; // (cl+1) 个 1 

21 n |- mask « (c 0 - 1 ); 

22 

23 return nj 

24 } 


4 .算术 解法： 获取后一个数 

如果 c0 是拖尾0的个数， cl 是拖尾0左方全为1的位的个数，而且 p = c0 + cl , 于是我们就 
可以将前面的解法表述如下。 

(1) 将位 pJSl 。 

(2) 将位0到位 p 淸零。 

(3) 将位0到位 cl - lftl „ 

少骤1、2有一种快速做法.将拖尾 0 H 为 I (得到 p 个拖尾 I ),然后再加1。加1后，所有拖尾 I 
都会翻转，最终位 p 变为1,后面跟 p 个0。我们可以用算术方法完成这些步骤 u 

n +- 2c* - l; //将拖見0置 1. 得 《p 个施尾 a 
n +- 1; //先将 p 个1清零，然后位 p 改为1 

接着，用算术方法执行步骤3, 如下： 

n +- 2 C, ' 1 - 1; //将換•足的 cl • 1个0罝为1 

上面的数学运算可缩减为： 

next - n + (2 c6 - 1) ♦ 1 + (2 C, ' 1 - 1) 

-n + 2 C# + 2 cl * 1 - 1 

这种做法的精妙之处在于，只需一两个位操作，代码写起来也很简单。 

1 int getNextArith(int n) { 

2 f* 计算 c0 和 cl, 來之前一样 •/ 

3 return n + (1 « c0) + (1 « (cl - 1)) - 1; 


5 .算术 解法： 获取前一个数 

如果 cl 是拖尾 I 的个数， C 0 是拖尾 I 右方全为0的位的个数，则 p = c 0 + cl , 前面的 getPrev 
可以重新表述如下。 

(1) 将位 P 清零。 
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(2) 将位 p 右边的所有位置1。 

(3) 将位0到位 c 0 - 1清零。 

上述步骤用算术方法实现如下。为简化起见，这里假 Sn = 10000011，故 cl = 2且 C 0 = 5。 

n ― 2 CX - 1 ; // 清除拖足 1 ， n 变为 10000000 

n ― 1 ; // 转拖見0， n 变为 01111111 

n — 2 <§ * 1 - 1 ; // 转最右边 <c 0 -l> 个 1 ， n 变为 01110000 

由此 导出： 

next - n - ( 2 C1 - 1 ) - 1 - ( 2 ** 1 - 1 ) 

« n - 2 C1 - 2 C * ' 1 + 1 

和 getNextArith —样，实现起来很简单： 

1 int getPrevArith(int n ) { 

2 /• 计算 c0 和 cl, 采之莳一样 V 

3 return n - (1 « cl) - (1 « (c0 - 1))+1; 

4 > 

哟！别紧张，在面试中，你用不着写出上面所有解法，至少不会是在没有面试官的大力帮助 
之下。 

5.4 代码 （（ n & ( n -1)) == 0) 的具体含义。（第56页） 

解法 

我们可以由外而内来解决这个问 

1. ( A & B )==0 ft 什么意思？ 

意思是， A 和 B 二进制表示的同一位置绝不会同时为1。因此，如果 (n & ( n - l >) ■= 0,则 n 
和 n -1 就不会有共同的1。 

2 . 相比 n , n -1 长什么样？ 

试着动手做•下减法 （ 二进制或十进 制）， 结果会怎么样？ 

lieieneee [base 2] 593 iee [base 10 ] 

- 1 - 1 
= lieieieill [base 2] = S 93099 [base 10] 

当要将-个数减去 1 时，需要.注意最低有效位。如果最低有效位为1,则变为0,完毕。如果 
是0,你就必须从髙位“借” 1。-此，要逐一前往更高的位，将每个位从0改为1，直至找到1为 
止，并将这个1翻转成0,完毕。 

综上， n -1 会很像 n , 只不过 n 中低位的0在 n -1 中变为1, n 中最低有效位的1在 n -1 中变为0, 
示例如下： 

if n = abcdelOOO 
then n -1 = abcde 0111 


那么， （ n &( n -1>)==0 究竞表示什么？ 
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n 和 n -1 不存在同一位均为1的情况，因为两者的二进制表示 如下： 

if n = abcdel 060 
then n-1 = abcdeOlll 

abcde 必定全为 0, 也就是说， n 必须像是00001000,因此， n 的值是2的某次方。 

综上，这个问题的答案为 ： （(n & ( n - l ))== 0) 检查 n 是否为2的某次方 （ 或者检查 n 是否为0 )。 

5.5 编 写一个 函数，确定需要改变几个位，才能将整数々转成整数 S 。 （第57页） 

解法 

这个问题看似复杂.实则非常简单。要解决这个问题，就得设法找出两个数之间有哪些位不 
同。很简单，使用异或 （ XOR ) 操作即可。 

>在异或操作的结果中，每个1代表^和細应位是不一样的。因此，要找出/<和5有多少个不同 
的士, 只要 数一数 有几个位为1。 

1 int bitSwapRequired(int a , int b ) { 

2 int count ■ 0; 

3 for (int c ■ a A b ; c !- 0; c - c » 1) { 


count c & 1; 



上面的代码已经很不错了，不过还可以做得更好。上面的做法是不断对 C 执行移位操作，然 
后检査最低有效位，但其实可以不断 翻转® 低有效位，计算要多少次 C 才会变成0。操作 c = c & 
(C - 1) 会淸除 C 的最低有效位。 

下面的代码运用了这个方法。 

1 public static int bitSwapRequired(int a , int b ) { 

2 int count * 0 ; 

B for (int c » a A b ; cl «0; c « c 4 ( c -1)) { 



这段代码是偶尔会在面试中出现的位操作问題。如果之前从末见过，一时很难在面试现场想 
出来，记住这个技巧，对面试会很有帮助 n 

5.6 编写程序，交换某个整数的奇数位和偶数位.使用指令越少越好（也就是说，位0与 
位1交换，位2与位3交换，依此类推)。（第57页） 

解法 

跟之前几个问题一样，从不同角度考虑这个问题会很有帮助。要操作一对一对的位，必定困 
难重重，效率也不见得会高。那么，还有其他什么方式来解决这个问题？ 

我们可以这 么做： 先操作奇数位，然后再操作偶数位。有办法将数字 n 的奇数位左移或右移1 
位吗？当然有。我们可以用10101010 ( EP 0 XAA ) 作为掩码，提取奇数位，并将它们右移1位，移 
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到偶数位的位置。对于偶数位，可以施以同样的操作。最后，将两次操作的结果合并成一个值。 
这种做法共需5条指令，实现代码如下。 

1 public int swapOddEvenBits(int x) { 

2 return ( ((x ft Oxaaaaaaaa) >> 1) | ((x & 0x55555555) « 1 ))； 

3 } 

上述 Java 代码实现的是 32 位整数。如欲处理64位整数，那就 ® 要修改掩码。不过，处理逻辑 
还是一样的。 

5.7 数组 A 包含0到 A ) 的所有整数.但其中缺了 一个。 在这个问題中.只用一次操作无法 
取得数组 A 里某个整数的完整内容。此外，数组 A 的元素皆以二进制表示，唯_可用的访问操 
作是“从 A [ i ] 取出第/位数据' 该操作的时间复杂度为常数。谪«写代码找出那个缺失的整数。 
你有办法在 0( ⑺时 间内完成吗？（第57页） 

解法 

你可能听到过非常类似的问题 ：给定 •列0到》的数，其中只缺 个 数字，把这个数找出来。 
这个问题解决起来很简单，直接将这列数相加，然后与0到的总和 （即 《*(/»+ 1)/2〉进行比较。 
两者差值就是那个缺失的粮数。 

至于这一题，我们可以根据每个整数的二进制表示，求出它的值，然后计算总和。 

这种解法的执行时间为 n * length (/ i >, 其中 length 为 n 巾有多少 个位。 注意， lcngth ( n ) = log 2 («) , 
因此，真正的执行时间为 0(/ ilog ( n )), 效率不够那么，我们该怎么办呢？ 

其实，我们可以使用类似的解法.不过会更直接第利用每个位的值。 

假设有下面这牲二进制数 （ ……表示移除的那个 数)： 

06000 eeiee eieee enee 

00601 eeiei eieei 01101 

eeeie eeue 01010 

- 00111 01011 

移除上面那个数会导 致域低 有效位 （ 记作 LSB ,) 中1和0的失衡。在0到《的数中，若/ I 为奇数， 
则0和1的数 ft 相同； 若 n 为偶数，則0比1的数 S 多一个，也就 是说： 

若 n X 2 ■■ 1 ， R<Jcount(es) * count (Is) 

若 n X 2 0, fjcount(0s) = 1 + count (Is) 

由此可见， count (0 s ) 必定大于或等于 count ( Is ) 。 

从这列数中移除数值 V 后，只要检查其他数值的最低有效位，马上就能知道 V 是偶数还是奇数。 
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因此，如果 count ( 0s ) <= count ( ls ) ,则 v 为偶数，如果 count (0 s ) > count ( ls ), 则 v 为奇数。 
那么，我们又该如何确定 v 的下一个位呢？如果这列数中含有 v 的话，我们就会发现如下规律 
( 其中 count 2 表示第二个最低有效位中0或1的个 数）： 
count 2 ( 0 s) = count 2 ( ls ) 或 count 2 (0 s ) = 1 + county Is) 

跟前面的例子一样，我们可以推导出 v 的第二个最低有效位 （ LSB 2 )。 







懸 J::' 





同样的，我们可以得出以下 结论： 

□ 若 count2 (0 s ) <= count 2 ( ls ), 则 LSB 2 ( v ) = 0。 

□ 若 count 2 (0 s ) > count 2 ( ls ), 则 LSBj ( v ) = 1。 

重复 t 述操作可以找出每个位.每次迭代时，我们数出位/中0和1的数世，检金 LSB <( v ) 是0还是 
1。然后，摒弃1^8,(；0!=1^々>的那些数字。也就是说，若 v 为偶数，则摒弃奇数，依此类推。 

在操作流程的最后，就可得到 v 所有位的值。在每一次迭代中.我们会査看/»个位，然后是》/ 
2个，接苕是 n /4 个，等等。因此，时间复杂度为 0( A /)。 

我们还可以更形象地演示整个过程„在第一次迭代时，有下面这些 数字： 


00000 eeiee eieee euee 

eeeei eeiei eieei 01101 

00010 00110 eieie 

- 明 m 01011 

由 countKOs ) > count ^ ls ) 町知 LSB 丨 (vp 1 。 W 此，摒除所有使得 LSBKx ) != LSBJv ) 的数 x 。 



eem 01011 


接着，由《：0111« 2 (05>>0011111 2 (叫可知[_88 2 ^)=1。因此，摒除所有使得 LSB 2 W != LSB 2 ( v > 的敗 r 。 



此时，由 count 3 (0 s )<= count3 ( ls ) 可知 LSBj ( v ) = 0。 因此，摒除所有使得 LSB 3 ( jc ) != LSB 3 ( v ) 的数*。 



最后只剩下一个数字了，此时 count4 (0 s ) <= county Is )， 因此 LSB 4 ( v ) = 0。 
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摒除所有使得 LSB 4 (v) !=0 的数字之后，我们得到一个空的列表。列表为空之后，可以得到 
countXOs) <= county 1 s) , 因此 LSB/(v) = 0 。 换句话说，一旦列表为空，即可将 v 的其余位填为 0 。 
在上面的示例中，整个操作流程将算出 v = 00011 。 

下面是该算法的实现代码，我们按位值切分整个数组，借此实现了摒除部分代码。 

1 public int findMissing(ArrayList<BitInteger> array) { 

2 /* bit 0 对应于 LSB. 以此为起点， 

3 * 逐少向较高的位推进 V 

4 return findMissing(array, 0); 

5 > 

6 

7 public int findMissing(ArrayList<BitInteger> input, int colunn) { 

8 if (column >= Bit Integer. INTEGER_SIZE) { // 终止条件与错误条忤 

9 return 0; 

10 } 

11 ArrayList<BitInteger> oneBlts ■ 

12 new ArrayList<BitInteger>(input.size( )/2) ; 

13 ArrayList<BitInteger> zeroBits ■ 

14 new ArrayList<BitInteger>(input.size( )/2) ; 

15 

16 for (Bitlnteger t : input) { 

17 if (t.fetch(column) ■■ 0) { 

18 zeroBits.add(t); 

19 > else { 

20 oneBits.add(t); 

21 > 

22 } 

23 if (zeroBits• sizeO <■ oneBits.slzeO) { 

24 int v * findMissing(zeroBits, column ♦ 1); 

25 return (v « 1) | 0; 

26 } else { 

27 int v * findMlssing(oneBlts, column + 1); 

28 return (v « 1 ) | 1 ; 

29 > 

30 } 

在第 24 和 27 行，我们会以递归方式计算出 v 的其他位。然后，再根据 count|(0s) <= count|(ls) 
是否成立，插人 0 或 1 。 

5.8 有个单色屏幕存储在 _ 个 _ 维字节数组中，使得 8 个连续像素可以存放在一个字节 
里。屏幕宽度为 w, 且 w 可被 8 整除 （ BD— 个字节不会分布在两行上），屏幕高度可由数组长度 
及屏幕宽度推算得出。 ' 请实现_个函数 drawHo 「 izontalLine(byte[] screen, int width, int 
xl, int x 2 , int y), 绘制从点⑶， y) 到点 (x 2 , y) 的水平线。（第 57 页） 

解法 

这个问题有个粗糙的简单 解法： 用 for 循环迭代，从 xl 到 x2, — 路设定每个像素。但这么做 
太没劲了，是吧？（况且效率也不高。） 

更好的做法是，如果 xl 和 x 2 相距甚远，其间包含几个完整字节。只要使用 screen[byte_pos] 
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= 0XFF, 一次就能设定一整个字节。这条线起点和终点剩余部分的位，可用掩码设定。 

1 void drawLine(byte[] screen, int width ， int xl, int x2, int y) { 

2 int start_offset = xl % 8; 

3 int first_full_byte = xl / 8; 

4 if (start_offset != 0) { 

5 first_full_byte++; 

6 } 

7 

8 int end_offset = x 2 % 8; 

9 int last_full_byte - x2 / 8; 

10 if (end_offset !® 7) { 

11 last 一 full_byte--; 

12 > 

13 

14 // 设定完整的字节 

15 for (int b ■ first_full_byte; b <■ last_full_byte; b-f+) { 

16 screen[(width / 8) * y + b] - (byte) 0xFF; 

17 > 

18 

19 // 创建用于线条起点和綷点的袴码 

20 byte startjiiask ■ (byte) (0xFF >> start_offset); 

21 byte end_mask « (byte) *^(0xFF >> (end_offset + 1)); 

22 

23 // 设定 ft + 的起点和终点 

24 if ((xl / 8) — (X2 / 8)) { // xl 和 X2 位于 W —字节 

25 byte mask » (byte) (startjaask & end_nask); 

26 screen[(width / 8) * y + 7x1 / 8)] |« mask; 

27 > else { 

28 if (start_offset !■ 0 ) { 

29 int byte_nunber * (width / 8) * y ■*■ first_full_byte - 1; 

30 screen 【 byte_nunber ] 卜 start mask; 

31 > 

32 if (end-offset !- 7) { 

33 int byte_number » (width / 8) * y ♦ last-full-byte + 1; 

34 screen[byte_number] |« end_mask; 

35 } 

36 > 

37 > 

务必小心处理这个问题，其中暗藏许多“陷阱”和特殊情况。例如，你必须考虑到 XI 和 X2 
位于同一宇节的悄况。只有那些最细心的求职者，才能毫无纰漏地写出这段代码。 

9.6 智力题 


6.1 有20瓶药丸，其中19瓶装有1克/粒的药丸，余下一瓶装有 1.1 克/粒的药丸。给你 
- 台称重精准的天平，怎么找出比较重的那瓶药丸？天平只能用 一次。 （第59页） 

解法 

有时候，严格的限制条件有可能反倒是解题的线索。在这个问题中，限制条件是天平只能用 
一次 o 
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因为天平只能用一次，我们也得以知道一个有趣的 事实： 一次必须同时称很多药丸，其卖更 
准确地说，是必须从19瓶拿出药丸进行称重。否则，如果跳过两瓶或更多瓶药丸，又该如何区分 
没称过的那几瓶呢？别忘了，天平只能用一次。 

那么，该怎么称重取自多个药瓶的药丸，并确定哪一瓶装有比较重的药丸？假设只有两瓶药 
丸，其中一瓶的药丸比较重。每瓶取出一粒药丸，称得重量为 2.1 克，但无从知道这多出来的 0.1 
克来自哪一瓶。我们必须设法区分这些药瓶。 

如果从药瓶#1取出一粒药丸.从药瓶#2取出两粒药丸，那么.称得重 fl 为多少呢？结果要看 
情况而定。如果药瓶#1的药丸较重，则称得重量为 3.1 克。如果药瓶#2的药丸较重，则称得重 M 
为 3.2 克。这就是这个问题的解题窍门。 

称一堆药丸时，我们会有个“预期”重 M 。 而借由预期® M 和实测重量之间的差别，就能得 
出哪一瓶药丸比较重，前提是从每个药瓶取出不同数量的药丸。 

将之前两瓶药丸的解法加以推广.就能得到完整 解法： 从药瓶#1取出一粒药丸，从药瓶#2 
取出两粒，从药瓶《取出三粒，依此类推。如果每粒药丸均重1克，则称得总重 fi 为210克（1 + 2 
+…+ 20 = 20 * 21 / 2 = 210), “多出来的”重 fi 必定来&每粒多 0.1 克的药丸。 

药瓶的编号可由算式 (weight - 210 grams ) / 0.1 grains 得出。因此.若这堆药丸称得重 
址为21 1.3 克，则药瓶#13装有较重的药丸。 

6.2 有个 8 x8 棋盘.其中对角的角落上.两个方格被切掉了。给定31块多米诺骨牌， 
—块 骨牌恰好可以覆盖两个方格。用这31块骨牌能否盖住整个棋盘？请证明你的答案（提供范 
例，或证明为什么不可能 ) 。（第59页） 


解法 

乍看， 似乎是可以盖住的。棋盘大小为 8 x 8, 共有64个方格，但其中两个方格已被切掉， 
因此只剩62个方格。31块骨牌应该刚好能盖住整个棋盘，对吧？ 

尝试用骨牌盖住第 I 行.而第1行只有7个方格，因此有一块骨牌必须铺至第2行。 Ifl ] 用 骨牌盖 
住第2行时，我们乂必须将一块骨牌铺至第3行。 



要盖住每一行，总有一块骨牌必须铺至下一行。无论尝试多少次、多少种方法，我们都无法 
成功铺下所有骨牌。 
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其实，还有更简洁更严谨的证明说明为什么不可能。棋盘原本有32个黑格和32个白格。将对 
角角落上的两个方格（相同颜色）切掉，棋盘只剩下 3( Kh 同色的方格和32个另一种颜色的方格。 
为方便论证起见，我们假定棋盘上剩下3#黑格和32个白格。 

放在棋盘上的每块骨牌必定会盖住一个白格和一个黑格。因此，31块骨牌正好盖住31个白格 
和31个黑格。然而，这个棋盘只有 3( Kh 黑格和32个白格，所以，31块骨牌盖不住整个棋盘。 

6.3 有两个水壶，容置分别为5夸脱（美 制： 1夸脱 =0.946 升， 英制： 1夸脱 =1.136 升） 
和3夸脱.若水的供应不限置（但没有置杯），怎么用这两个水壶得到刚好4夸脱的水？注意， 
这两个水壶呈不规则形状.无 法糯准 地装满'•半壶”水。（第59页） 

解法 

根据题意，我们只能使用这两个水壶.不妨随意把玩一番，把水倒来倒去，可以得到如下顺 
序 组合： 


5夸脱 

3夸脱 

注 解 

5 

0 

装满5夸说水壶 

2 

3 

用5夸说水壶电的水装满3夸脱水壶 

0 

2 

把5夸说水壶电的 水倒人 3兮脱水壶 

5 

2 

装满5夺说水壶 

4 

3 

用5夸说水壶甩的水填满3夸脱水壶 

4 


搞定！准确 里:得 4夸脱. 


注意，许多智力题其实都隐含数学或计算机科学的背妹，这个问题也不例外。只要这两个水 
壶的容 ft 互质（即两个数没有共同的质因 子）， 我们就能找出一种倒水的顺序组合， M 出1到2个 
水壶容 量总和 （含）之间的任意水量。 

6.4 有个岛上 住着一 群人，有了个游客，定了 1奇怪的规矩：所有蓝眼《的人都 
必须尽快离幵这 个岛。 每晩8点 会有一 个航班离岛。每个人都看得见别人 眼睛的 颜色.但不知道 
自己的（别人也不可以吿 知)。 此外，他们不知遒岛上到底有多少人是蓝眼睛的，只知道至少有 
一个人的眼睛是蓝色的。所有蓝眼睛的人要花几天才能离幵这个岛？（第59页） 

解法 

下面将采用简单构造法。假定这个岛上一共有 n 人，其中 c 人有蓝 眼睹。 由题目可知， c >0„ 

1. 情况 c =1: 只有一人是蓝眼睛的 

假设岛上所有人都是聪明的，蓝眼睹的人四处观察之后，发现没有人是蓝眼睛的。但他知道 
至少有一人是蓝眼睛的，于是就能推导出自己一定是蓝眼睛的。因此，他会搭乘当晚的飞机离开。 

2. 情况 c = 2: 只有两人是蓝眼睛的 

两个蓝眼睛的人看到对方，并不确定还是2,但是由上一种情况，他们知道，如果 cr = l , 
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那个蓝眼睛的人第一晚就会离岛。因此，发现另一个蓝眼睛的人仍在岛上，他一定能推断出 c = 2, 
也就意味着他自己也是蓝眼睛的。于是，两个蓝眼睛的人都会在第二晚离岛。 

3.情况 c >2: —般情况 

逐步提高 c 时，我们可以看出上述逻辑仍旧适用。如果 c = 3. 那么，这三个人会立即意识到有2 
到3人是蓝眼睛的。如果有两人是蓝眼睛的，那么这两人会在第二晚离岛。因此，如果过了第二晚另 
外两人还在岛上，每个蓝眼睛的人都能推断出 c = 3,因此这二人都有蓝眼睛。他们会在第三晚离岛。 

不论 c 为什么值，都可以套用这个模式。所以，如果有 c 人是蓝眼睛的，则所有蓝眼睛的人要 
用 dft 才能离岛，且都在同一晚离开。 

6.5 有栋建筑物高100层。若从第 A / 层或 更高的 楼层扔下来，鸡蛋就会破掉。若从第 A / 
层以下的楼层扔下来则不会破掉。给你2个鸡蛋，谪找出 N , 并要求最差情况下扔鸡蛋的次数 
为最少。（第59页） 

解法 

我们发现，无论怎么扔鸡蛋1 (Egg 1), 鸡蛋2 (Egg 2) 都必须在“破掉那一层”和下 j 不 
会破掉的最高楼层之间，逐层扔下楼（从最低的到 M 商的)。例如，若鸡蛋1从5层和10层楼扔下没 
破掉.但从15层扔下时破掉了，那么，在 ft 差悄况 T , 鸡蛋2必须尝试从11、12、13和14层扔下楼。 

具体做法 

首先，让我们试着从10层开始扔鸡蛋，然后是20层，等等。 

□ 如果鸡蛋1第一次扔下楼 （ 10层）就破掉了，那么.最多需要扔10次。 

□ 如果鸡蛋1最后一次扔下楼 （ 100层）才破掉，那么.最多要扔19次（10、20、…、90、 
100层，然后是91到99层)。 

这么做也挺+错，但我们只考虑了绝对最差情况。我们应该进行“负载均衡”，让这两种情 
况下扔鸡蛋的次数更均匀。 

我们的目标是设计一种扔鸡蛋的方法.使得扔鸡蛋1时，不论是在第一次还是最后一次扔下 
楼才破掉，次数越稳定越好。 

(1) 完美负载均衡的方法应该是，扔鸡蛋 I 的次数加上扔鸡蛋2的次数，不论什么时候都一样， 
不 管鸡蛋1是从哪层楼扔下时破掉的。 

(2) 若有这种扔法，每次鸡蛋1多扔一次，鸡蛋2就可以少扔一次。 

(3) 因此.每丢一次鸡蛋1,就应该减少鸡蛋2可能需要扔下楼的次数。例如，如果鸡蛋1先从 
20层往下扔，然后从30层扔下楼，此时鸡蛋2可能就要扔9次。若鸡蛋1再扔一次，我们必须让鸡 
蛋2扔下楼的次数降为8次。也就是说，我们必须让鸡蛋1从39层扔下楼。 

(4) 由此可知，鸡蛋1必须从 A 层开始往下扔，然后再往上增加尤 -1 层……直至到达100层。 

(5) 求解方 ( AM ) + ( X -2) + — +1 = 100, 得淑 ( X + 1) /2 = 100 — 尤=14。 

我们先从14层开始，然后是27层，接着是39层，依此类推，最差情况下鸡蛋要扔14次。 

正如解决其他许多最大化/最小化的问題一样，这类问题的关键在于“平衡最差情况”。 
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6.6 走廊上有100个关上的储物柜。有个人先是将100个柜子全都 打幵。 接着，每数两个 
柜子关上_个。然后，在第三轮时，再每隔两个就切换第三个柜子的幵关状态（也就是将关上的 
柜子打幵，将打幵的关上)。照此规律反 隻操作 100次，在第/轮，这个人会每数/个就切换第/_ 
个柜子的状态。当第100轮经过走廊时，只切换第100个柜子的幵关状恣，此时有几个柜子是 
幵着的？（第59页） 


解法 

要解决这个问題，我们必须弄清楚所谓切换储物柜开关状态是什么意思。这有助于我们推断 
最终哪些柜子是开着的。 

1. 问题： 柜子会在哪几轮切换状态（开或关）？ 

柜子#在《的每个因子 （ 包括1和》 本身） 对应的那一轮切换状态„也就是说，柜子15会在第 
1、3、5和15轮开或关一次。 

2. 问题：柜子什么时候还是开着的？ 

如果因子个数（记作; t ) 为奇数，则这个柜子是开着的。你可以把一对因子比作开和关，若 
还剩一个因子.则柜子就是开着的。 

3. 问 題： Jf 什么时候为奇数？ 

若 n 为完全平方数，则 x 的值为奇数。理由 如下： 将 n 的两个互补因子配对。例如，如《为36, 
则因子配对情 况为： （1,36)、（2,18)、（3,12)、（4,9)、（6,6)。注意， （6, 6) 其实只有一个因子，因 
此的因子个数为奇数。 

4. 问 题： 有多少个完全平方数？ 

-共有1叶完全平方数，你可以数一数 （ 丨、4、9、16、25、36、49、64、81、 100), 或者， 
直接列出1到10的 平方： 

1*1, 2 * 2 , 3*3, 10*10 

因此，最后共有10个柜子是开着的。 

9.7 数学与概率 

7.1 有个篮球框， T ® 两种玩法可任选 一种。 

玩法1:-次出挪会，隨命中齡。 

玩法2:三次出手机会，必须投中两次。 

如果 P 是某次投篮命中的概率•则 p 的值为多少时，才会选择玩法1或玩法2?(第63页） 

解法 

要解此题，我们可以直接运用概率论，比较贏得各种玩法的概率： 
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1. 贏 得玩法1的 槪率： 

根据定义，贏得玩法1的概率为/»。 

2. 贏 得玩法 2 的 槪率： 

令〆为 n 次投篮准确投中 k 次的概率，贏得玩法2的概率是三投两中或三投三中的概率。换 
句 话说： 

/>(获胜)=片2,3) + 彳3>3) 

三投三中的概 率为： 
s (3, i )= p 3 
三投两中的概 率为： 

P (第1、2次投中，第3次未 投中） 

+ />(第1、3次投中，第2次未 投中） 

+ />(第I次未投中，第2、3次 投中） 

=p*p*il-p)+p*(\-p)*p + (\-p) *p*p 
= 3 (1-/0〆 

两者概韦相加，可以 得到： 

=p i + 3(\-p)p 1 

= p 3 + 3 p 2 -3 p i 



3. 该选择哪种玩法？ 

若/ 1 (玩法1)> P (玩法 2), 则该选择玩法1: 
p > 3 p 2 -2 p 3 
1 > 3 p -2 p 2 
2 p 2 -3 p + 1 >0 

(2 p -\){ p -\)>0 

左边两项必须同为正数或同为负数， M 然， p <\. 故 p-l<0, 也即这两项必须同为负数。 

2 p -\ <0 
2 p <\ 

尸 <.5 

综上，若/ ><0.5, 则应该选择玩法1。 若 p = 0、 0.5 或1,则/>(玩法 1) = P (玩法2)，选哪种玩法 
都一样，因为贏得两种玩法的概率相等。 

7.2 三角形的三个顶点上各有 一 PJ 8 蚁。如果妈蚁幵始沿着三角形的边爬行，两只或三只 
蚂蚁撞在_起的概率有多大？假定每只妈蚁会随机选_个方向，每个方向被选到的几率相等，而 
且三只蚂蚁的爬行速度相同。 

类似问题：在/7个顶点的多边形上有 n 只蚂蚁，求出这些蚂蚁发生碰撞的概率。（第63页） 
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解法 

当其中两只蚂蚁互相朝着对方而行，就会发生碰撞。因此，蚂蚁不发生碰撞的前提是，它们 
都朝着同一方向爬行（顺时针或逆时针)。我们可以算出这种情况的概率.然后再反推出问题的 
答案。 

每只蚂蚁可以朝两个方向爬行，一共有3只蚂蚁，它们不发生碰撞的槪 率位： 

P (顺时针 )=( 汾 3 
P (逆时针)=(14) 3 
P (同方向 ) = ( V 4> 3 + (!4) 3 = V 4 

因此，发生碰撞的概率就是蚂蚁不朝着同方向爬行的 概率： 

(碰撞> =1-行同方向 ） =1 - ( V 4) = % 

若要将这个方法推广至 / d ' 顶点的多边形.同样的，蚂蚁也只有以顺时针或逆时针同方向爬 
行才不致相撞，但总共有2”种爬行方式。综上.发生碰捶的槪 率为： 

P ( 顺时针 ) = ( V 4)" 

/>(逆时针)=(卻 
P ( 同方向)= 20^ =作广 I 
P (碰撞 ) =1-忾同方向> =1- 

7.3 给定直角坐标系上的两条线，确定这两条线会不会相交。（第63页） 

解法 

此题有很多不确定的地 方：两 条线的格式是什么？两条线实为同一条怎么处理？这些含糊不 
淸的地方最好跟面试官讨论一下。 

下面将做出以下 假设： 

□ 若两条线是相同的（斜率和截距相等），则认为这两条线 相交； 

□ 我们可以决定线的数据结构。 

两条线若不平行则必相交。因此.要检査两条线相交与否，我们只需检査两者的斜率是否相 
同，或是否为同一条。 

实现代码 如下： 

1 public class Line { 

2 static double epsilon = 0 . 000001 ; 

3 public double slope; 

4 public double yintercept; 

5 

6 public Line(double s, double y) { 

7 slope * s; 

8 yintercept = y; 


11 public boolean intersect(Line line2) { 

12 return Math.abs(slope - line2.slope) > epsilon || 

13 Math.abs(yintercept - line2.yintercept) < epsilon; 
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遇到这类问题时，务请注意以下几点。 

□ 多提问。此题存在诸多不明之处，多提问以厘清问题。许多面试官会故意提些模糊的问 
题，考察你是否会说明自己的假设条件。 

□ 尽量设计并使用数据结构，借此展示你了解并注重面向对象设计。 

□仔细考虑要怎么设计数据结构来表示一条线。选择多多，各有优劣，必须权衡取舍。选 
择一种数据结构，并说明理由。 

□ 不要假设斜率和>#截距就是整数。 

□ 了解浮点表示法的限制。切记不要用==检査浮点数是否相等，而是应该检査两者差值是 
否小于某个极小值 （ 如上面代码中的 epsilon 值)。 


7.4 编写方法，实现整数的乘法、滅法和除法运算。只允许使用加号。（第63页） 


解法 

此题只允许使用加号运算符。对于每个子问题，最好深人思考这些运算的本质，或者如何用 
其他运算表示（加法或已实现的运 算〉。 

1.减法 

怎样才能用加法表示减法？这个问埋宥起来苜截了当，运算 fl -/> 跟 ^ + (-1)*6 是一回事。不 
过，根据题意.不得使用乘号 （*), W 此我们必须实现一个取反 （ negate ) 的函数。 

1 /* 正 ft* 号， » 号1 正号 V 

2 public static int negate(int a) { 


int neg - 0 ; 



while (a !» 0) { 
neg +■ d; 
a +■ d; 



12 /* 两数相戒栩当于对 b 取反，然后将两數相加 */ 

13 public static int ninus(int a, int b) { 

14 return a + negate(b); 

15 > 

要对数值 it 的取反，只需将 -1 连加 it 次。 


2. 乘法 

加法和乘法之间关系也同样一目了然， a 乘以办其实就是将 oiS 加办次。 

1 /• 将 a 连加 b 次，实现 a 乘 b */ 

2 public static int multiply(int a, int b) { 

3 if (a < b) { 
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4 return multiply(b, a); // 若 b < a , 算法会比较快 

5 } 

6 int sum = 0; 

7 for (int i = abs(b); i > 0; i--) { 

8 sum -fs a; 

9 > 

10 if (b < 0) { 

11 sum » negate(sun); 

12 } 

13 return sum; 

14 } 

15 

16 /* 返田絶对值 V 

17 public static int abs(int a) { 

18 if (a < e ) { 

19 return negate ⑷； 

20 } else { 

21 return a; 

22 > 

23 > 

在上面的代码中，有个地方必须妥轉处理，就是负数的乘法。若6为负数，则需将 sum 的值正 
负反一下。 W 此，这段代码实际上是这么 回事： 
multiply(a, b) <-- abs(b) • a • (-1 if b < 0). 

我们还实现了一个简单的 abs 辅助函数。 


3. 除法 

在减、乘、除7种运算中，除法无疑是最难的。好在我们可以利用已有的 multiply , subtract 
和 negate 等方法实现 divide 。 

除法要做的是计算 x = a / 6中的;或者，换个角度来说，找到使得 a = 这么一来，经 
过变换，这个问题就可以用之前已实现的乘法运算实现。 

我们可以将6不断乘以逐级变大的值，直至得到 a 。 这么做非常低效，特别是前面的 multiply 
实现含有大量加法运算。 

或者，我们可以好好利用等式 = 将6与它自身连加直至得到 a , 就能算出*。6与自身连 

加的次数就等于 x 的值。 

当然， a 不一定能被6整除，这也没关系。这个问题要求实现的是整数除法，本来就应该对结 
果向下舍人 （floor ) 0 

下面是这个算法的实现代码。 

1 public int divide(int a, int b) 

2 throws java.lang.ArithnieticException { 

3 if (b == 0 ) { 

4 throw new java.lang.ArithmeticException(“ERROR”>; 

5 } 

6 int absa = abs(a); 

7 int absb = abs(b); 

8 
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,nt product = 0; 
nt x * 0; 

rhile (product + absb <= absa) { /* 不要超过 a •/ 
product += absb; 


f ((a < 0 && b < 0 ) || (a > e && b > 0 )) 
return x; 
else { 

return negate(x); 


解决此题时，应当注意以下几点。 

口多想想乘法和除法的本质，以逻辑思考的方式解题，这么做很管用。记住，所有（好 的） 
面试题都能以逻辑、系统的方式解出来！ 

□ 面试官想找的就是这种能以逻辑思考逐步解决问题的人。 

□ 这是个让你展示自己能够写出干净代码的绝佳问题，特別是显示出你复用代码的能力。 
例如，如果写代码时没有把 negate 独立出来，但要是发现相关代码使用多次，就应该将 
这些代码写成一个方滏。 

□ 写代码时要小心假设。不要假设所冇数都是 iK 数，也不该假设比6大。 


7.5 在二维平面上，有两个正方形.请找出一^直线，能够将这两个正方形对半分。假定 
正方形的上下两条边与 x 轴平行。（第 63 页） 

解法 

在着手解题之前，有必要思考一下题中一条“线”的准确含义。一条线是由斜率和 y 轴截距 
确定？还是由这条线上的任意两点定义？抑或，所谓的线其实是线段，以正方形的边作为起点和 
终点？ 

其中第三种情况会让此题变得更有意思一因此这里 假设： 这条线的端点应该落在正方形 
的边上。在面试中，你应该与面试官讨论假设条件。 

要将两个正方形对半分，这条线必须连接两个正方形的中心点。利用 slope = 就能算 

出斜率，以两个中心点算出斜率后，就能以 同一公 式求得线段的起点和终点。 

在下面的代码中，假设原点(0,0泡于左上角。 

1 public class Square { 

2 ... 

3 public Point middle() { 

4 return new Point((this.left + this.right) / 2.0, 

5 (this•top + this.bottom) / 2.0); 


/* 返固连接 midl>mid2 的钱段与 square 1 
* 的边相交的点 . 也就是说 . 从 nid2 到 midi 
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* 条线，一直廷伸直至碰到 square 1 的 
* 边 

V 

public Point extend(Point midi. Point mid2， double size) { 
/* 找出线段 i«id2 -> «iidl 的方句 */ 
double xdir = midl.x < mid2.x ? -1 : 1; 
double ydir » midl.y < mid2.y ? -1 : 1; 

/* 若 midi 和 《iid2 的 x 坐标相同.计算斜芈时 
* 会抛出除零异常，因此这里要做特則的处理 

V 

if (midl.x ■- mid2.x) { 

return new Point(midi.midl.y + ydir * size / 2.0); 


double slope ■ (midl.y - nid2.y) / (nidl.x - mid2.x); 
double xl ■ 0 ; 
double yl - 0; 

/• 利用算式 (yl - y2> / (xl - x2> 计算斜率 (slope). 

• 注意，若斜芈很 "fit 作 ” (>1) . 昴么线段的终点将会 
• 碰到 y|* 上庇鳥中心点 size / 2 的位置.若斜丰 
* 不 «i) , 邶 么幾段 的终点将碰到 x 榦上典 
* 离中心点 size / 2 的位罝 
V 

if (Math.abs(slope) ― 1) { 

xl - nidl.x 4 - xdir * size / 2.0; 
yl ■ nidl.y ♦ ydir • size / 2.0; 

> else if (Hath.abs(slope) < 1) { 

xl - midl.x + xdir * size / 2.e ； 
yl ■ slope * (xl - midl.x) + midl.y; 

> else { 

yl ■ midl.y + ydir * size / 2.0; 
xl ■ (yl - midl.y) / slope + midl.x; 

> 

return new Point(xl, yl); 


public Line cut(Square other) { 

/* 计算两个中心点之间的线段与正方形的边相交的位置 */ 

Point point_l = extend(this.middle (), other.niddle(), this.size); 

Point point_2 ■ extend(this.middle()« other.niddle() # -1 * this.size); 

Point point_3 * extend(other.middle(), this.nlddleO^ other.size); 

Point point_4 * extend(other.niddle(), this._iddle(〉, -1 * other.size); 

/* 在上南这姿点中，找出线段的起点扣终点.起点以最左边且在上方的为准， 

* 终点以最右边且在下方的为准 */ 

Point start = point_l; 

Point end = point_l; 

Point[] points » {point_2, point_3, point 一 4}; 
for (int i = 0 ; i < points.length; i++) { 

if (points[i].x < start.x || (points[i].x == start.x && points[i].y < start.y)) { 
start = points[i]; 

} else if (points[i].x > end.x || (points[i].x == end.x && points[i].y > end.y)) { 
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end = points[i]; 

} 

> 

return new Line(start, end); 


此题意在考察你写代码有多细心，毕竟写代码时很容易漏掉一些特殊情况，比如两个正方形 
的中心点重合。着手解題之前，我们就应该列出这些特殊情况，并确保予以妥善处理。解题时， 
测试必须仔细、全面。 

7.6 在二维平面上，有一些点.请找出经过点数最多的那条线。（第63页） 

_法 

此题乍一看很 简申， 老实说，确实有点。 

我们只需在任意两点之间“画” 一条无限长的直线 （ 也即不是线段），并利用散列表追踪哪 
条直线出现次数最多。这种做法的时间复杂度为 0( M ), 因为一共有 AT 2 条线段。 

我们将用斜率和>«1截距是两个点来表示一条线，这样一来，检査 ( x ^)、（ x 2 ,_ y 2 ) 确定的 
直线是否等于 ，乃) 到的直线就相对简单。 

要找到出现次数 铋多的 宜线，只 X 迭代遍历所有线段，并用敗列表数出每条宜线出现的次数。 
够简笮吧！ 

不过，其中有个地方比较棘手。首先，我们定义，若两条直线的斜率和轴截距相间，则这 
两条直线相等。接着，我们会基于这些值（确切地说，是基于斜率）对直线进行 散列。 问题是浮 
点数不一定能用二进制精确表示 3 对此，我们的解决办法是检査两个浮点数的差值是否在某个极 
小值 （ epsilon ) 内。 

对散列表而言，这乂意味着什么呢？这意味着，斜率“相等”的两条直线，散列值未必相同。 
为此，我们将把斜韦减去一个极小值，并以得到的结果 flooredSlope 作为散列键。然后，要取 
得所有可能相等的直线，我们会搜索二个位置： flooredSlope 、 flooredSlope - epsilon 和 
flooredSlope + epsilon 。 这能确保我们已检査了所有可能相等的査线。 



Line findBestLine(GraphPoint[] points) { 

Line bestLine = null; 
int bestCount * 0; 

HashMap<Double i ArrayList<Line>> linesBySlope - 
new HashHap<Double, ArrayList<Line>>(); 

for (int i * 0; i < points.length; i++) { 

for (int j = i + 1 ; j < points.length; j4-f) { 

Line line = new Line(points[i] 4 points[j]); 
insertLlne(linesBySlope, line); 

int count * countEquivalentLines(linesBySlope, line); 
if (count > bestCount) { 
bestLine = line; 
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public boolean isEquivalent(double a, double b) { 
return (Math.abs(a - b) < epsilon); 


public boolean isEquivalent(Object o) { 

Line 1 ■ (Line) o; 

if (isEquivalent(1.slope 4 slope) && 

isEquivalent(1.intercept« intercept) && 
(infinite_slope *= 1 .infinite_slope)> { 
return true; 

} 

return false; 


计算直线的斜率务必小心灌慎。直线有可能完全垂直，也即它没有#截距且斜率无穷大。 
我们可以用单独的标记 （ infinite_slope ) 跟踪记录。在 equals 方法中，必须检査这个条件。 

7.7 有些数的素因子只有3、5、7,请设计一个 算法. 找出其中第 / f 个数。（第63页） 


解法 

根据定义，这些数字看起来都像*5»* 7% 

卜面 先列出符合该形式的数字，此题要求找出这种数字里的第 


1 

- 

3 # 


5* 

傘 

7® 

3 

3 

3 1 


5 # 

拿 

7® 

S 

5 

3 0 


5 1 

* 

7® 

7 

7 

3 6 


5* 

* 

7 1 

9 

3*3 

3 2 


5* 

拿 

V 

15 

3*5 

3* 


5 1 

傘 

V 

21 

3*7 

3 1 


5* 

傘 

7* 

25 

5*5 

3 9 


5 2 

* 

V 

1 

- 

3 6 


5 # 

* 

V 

27 

3*9 

3 3 


5* 

* 

V 

35 

5*7 

3 # 


5 1 

* 

V 

45 

5*9 

3 2 


5 1 

拿 

7® 

49 

7*7 

3 0 


5* 

* 

V 

63 

3*21 

3 2 


5 # 

傘 

7 1 


由于3 0 * 1 *5**7"<3 a * 5**7", 因此 3*^*5* 幸，必定已在我们的列表中出现过。实际上，下 
面这些值已在列表中出现 过了： 

□广1 * 5* • T 

□ 3°* 5* -1 * T 
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□ 3° * 5 & * 7^* 

另一种思路是，所有数字都可以表示成如下 形式： 

□ 3 * (列表中之前出现的某个数） 

□ 5 * (列表中之前出现的某个数） 

□ 7 * (列表中之前出现的某个数） 

由此可知， A» 可以表示为(3、5或 7)*({A, ,...， A^} 中的某个值)。另外，根据定义可知， 

是列表中的下一个数。因此，八淋是最小的新增数字（其余更小的数已在 {A 中），可以 
通过将列表中的每个值与3、5或7相乘得到。 

怎样才能找到 A 4 ? 实际上.我们可以将列表中的数字与3、5和7相乘，找出还未加人列表的 
最小数。这种解法的时间复杂度为 0C* 2 )。 不算太糟，不过我想还可以做得更好。 

之前我们曾试着从列表中的元素“拉出” A*( 将这些元素与3、5和7相 乘)， 其实可以换个思路， 
可以让列表中的元素“推出”三个后续值，也就是说，列表中的每个数 W 将以下列形式 出现： 

□ 3*A ( 

□ 5*A ( 

□ 7*A, 

照若这个思路亊先做好准备，每次要将 A 加人列表时，就用某个临时列表存放 3A,、5A, 和 7A, 
三个值。要产生 A w 时，我们会捜索这个临时列表，找出最小的值。 

我们的代码大致 如下： 
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27 val = renoveMin(q); 

28 addProducts(q, val); 

29 > 

30 return val; 

31 } 

相比第一种解法，这个算法确实要好得多，但仍不够完美。 

为了产生新元素 A ,, 我们会搜索一整个链表，其中每个元素类似如下形式之一： 

□ 3* 之前的元素 

□ 5 * 之前的元素 
口 7 • 之前的元索 

我们还可以优化掉哪些无谓的操作？ 

假设有如下列表。 

q 6 = {7 A ,, 5 A 2 , 7 A 2 . 7 A 3 , 3 A * 7、 5 A fc 7 A 5 } 

要在列表中査找最小值时，先检査是否成立，然后检査 7 A 5 < min 。 这看起来有点 
笨拙，是不是？既然已经知道 A ,< A 5 , 因此只需检査 7 A , 即可。 

若从一开始就按常数因子将列表分组存放，那就只需检査3、5和7倍数的第一个，后续元素 
—定比第一个元素大。 

也就是说，上面的列表应该 如下： 

Q 36={3 A 4 
Q 56={5 A 2 ,5 A 4, 5 A s } 

Q 76= {7 A ,, 7 A 2 , 7 A 3 , 7 A 4, 7 A s } 

要求得最小值，我们只需检丧各个队列的队首元索。 
y = min ( Q 3. hcad (), QS . hcad (), Q 7. hcad ()) 

求出后，就要把 3_ v 插人 Q 3、5 y 插人 Q 5、7 y 插人 Q 7。 不过，只有这些元索在其他列表中不存 
在时，我们才会将它们插人列表。 

举个例子，为 什么杪 可能已经存在某个队列中？很简单，如果#从 Q 7 拉出来的，就表 示;^ 
lx , x 是某个较小的值。如果 7 x 是最小值，那么，我们一定碰到过 3 x 。 碰到时会怎么做呢？我 
们会将7 * 3; t 插人 Q 7。 注意， 7*3 x = 3*7 x = 3 y 。 

换句话说，如果从 Q 7 拉出一个元素，它看起来像 7* suffix , 而我们知道已处理过3 * suffix 和 
5* suffix 。 处理 3* suffix 时，将7 * 3 * suffix 插人 Q 7。 而处理 5* suffix 时，我们知道已经将 7*5* 
suffix 插人 Q 7 。 至此，唯一还未碰到的值是 7*7* suffix , 因此我们只会将7 * 7 * suffix 插人 Q 7。 
下面我们会举例说明，真正做到心知肚明。 

—开始： 

Q3 = 3 
QS ■ 5 
Q7 » 7 

取出 min = 3, Q3 接入 3*3, Q5 接入5*3, Q7 接入 7*3. 

Q3 = 3*3 
Q5 * 5, 5*3 





^/ = /”, 厂 5, 1 ” 

取出 min = 3«3 ■ 9, Q3 插入 3*3*3, Q5 插入 3*3*5, Q7 插入 3*3*7. 

Q3 ■ 3*3*3 

Q5 ■ 5.3, 5*5, 5*3*3 

Q7 ■ 7*3, 7*5, 7*7, 7*3*3 

取出 min * 5*3 » 15, 3*(S*3) 玄复了，因为已处《过 5*(3*3>, QS 插入 S*S*3, Q7 插入 7*5*3. 

Q3 ■ 3*3*3 

Q5 - 5*5, 5*3*3, 5*5*3 

Q7 ■ 7*3, 7*5, 7 * 7 , 7*3*3, 7*5*3 

取出 min = 7*3 - 21, 3*(7*3 〉和 S*(7*3 > 重复了 • 因为已处攻过 7*(3*3) 和 7*(5*3). Q7 接入 7*7*3. 
Q3 - 3*3*3 

Q5 - 5*5, 5*3*3, 5*5*3 

Q7 ■ 7*5, 7*7, 7*3*3, 7*5*3, 7*7*3 

此题解法的伪码如下。 

(1) 初始化 array 和 队列： Q 3、 Q 5 和 Q 7。 

(2) 将 1 插入 array 。 

(3) 分別将1*3、 1*5 和 1*7 插人 Q 3、 Q 5 和 Q 7。 

(4) 令 x 为 Q 3、 Q 5 和 Q 7 中的最小值。将 x 添加至 array 尾部。 

(5) 若 x 存 在于： 

_ Q 3, 则将 x *3、 产5和#7放人 Q 3、 Q 5 和 Q 7, 从 Q 3 移除 jr 。 

■ Q 5, 则将 x *5 和 jt *7 放人 Q 5 和 Q 7, 从 Q 5 移除 X 。 

■ Q 7, 则只将#7放人 Q 7, 从 Q 7 移除 

(6) 重复步骤4^6,直至找到第^元素。 

下面是该算法的实现代码。 
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32 


Integer.MAX_VALUE; 

int v7 - queue7.size() > 9 ? queue7.peek() : 

Integer.MAX_VALUE; 

val = Math.nin(v3 J Hath.«in(v5, v7)); 
if (val == v3) { // 放入队列 3. 队列 S 和队列 7 
queue3.remove(); 
queue3.add(3 * val); 
queue5.add(5 * val); 

> else if (val »= v5) { // 放入队列 S 和队列 7 

queue5.remove(); 
queue5.add(5 * val); 

> else if (val « v7) { // 放入队列 7 

queue7.renove(); 

> 

queue7.add(7 • val); // 总是放入队列 7 

> 

return val; 


碰到这个问题时.尽最大努力去解决，虽然问题确实有难度。你可以先从蛮力法开始（有挑 
战性，但不那么棘手），然后试着不断优化。或者，试着从这些数中找出规律。 

1你解题卡壳时，面试官有可能会帮你一把。不管怎样，绝不要放弃！大声说出你的思路、 
疑问，并解释你的思考过程。面试官或许就会介人指导一下。 

记住，面试官并不期待你给出完美无缺的解法，而是会对照其他求职者来评估你的表现。面 
对<1钻的问题，大家都需拼尽全力。 


9.8 面向对象设计 


8.1 请设计用于通用扑克牌的数据结构。并说明你会如何创建该数据结构的子类，实现 
“二十一点”游戏。（第66页） 

解法 

首先，看得出来所谓的“通用”扑克牌隐含有不少信息。这里的“通用”可以指能用来玩扑 
克牌游戏的标准扑克牌组，也可以扩展为 Uno 牌或棒球卡。面试时记得询问面试官“通用"的具 
体含义，这点很重要。 

假设面试官说清楚了.这是一副标准纸牌.一共52张，就如同你在二十一点或扑克牌游戏中 
使用的牌组。这样一来，整个设计大致 如下： 

1 public enum Suit { 

2 Club (0), Dianond (1 〉， Heart (2)，Spade (3); 

3 private int value; 

4 private Suit(int v> { value « v; } 

5 public int getvalue() { return value; } 

6 public static Suit get Suit F ro«\/a lue (i nt value) { ... } 
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9 public class Deck <T extends Card〉 { 

10 private Array List <T> cards; // 所有牌，包括已经发出去的，还未发出去的 

11 private int dealtlndex = 0 ; //标示第一依还木发出去的牌 

12 

13 public void setDeckQfCards(ArrayList<T> deckOfCards) { ... } 

14 

15 public void shuffle() { ••• } 

16 public int reaainingCards() { 

17 return cards.size() - dealtlndex; 

18 > 

19 public T[] dealHand(int number) { } 

20 public T dealCard() { ... } 

21 > 

22 

23 public abstract class Card { 

24 private boolean available ■ true; 

25 

26 /* 牌面的数字或人头，數字2#110，11为杰先， 

27 • 12为 史后， 13位国王，1为 Ace V 

28 protected int faceValue; 

29 protected Suit suit; 

Be 

31 public Card(int c 9 Suit s) { 

32 faceValue * c; 

33 suit - s; 

34 > 

35 

36 public abstract int value(); 

37 

38 public Suit suit() { return suit; } 

39 

40 /* 拴查这张牌是否发给莱个人 */ 

41 public boolean isAvailable() { return available; } 

42 public void markUnavailable() { available * false; } 

43 

44 public void markAvailableO { available ， true; } 

45 } 

46 

47 public class Hand <T extends Card》{ 

48 protected ArrayList<T> cards * new ArrayList<T>(); 

49 

50 public int score() { 

51 int score * 6; 

52 for (T card : cards) { 

53 score += card.value(); 

54 } 

55 return score; 

56 } 

57 

58 public void addCard(T card) { 

59 cards.add(card〉； 

60 > 

61 } 
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在上面的代码中，我们以泛型实现了 Deck, 同时把 T 的类型限定为 Car'd 。 另外，我们还将 Car'd 
实现成抽象类，这是因为如果不知道玩的是什么游戏，诸如 valueO 的方法就没有太大意义。（你 
可能会据理力争，认为这些方法还是应该实现为好，以标准标准扑克牌规则实现默认值。） 

现在，假设要构建二十一点游戏，我们需要知道这些牌的数值。人头牌 K 、 Q 、 J 等于 10, Ace 
为 11 ( 大部分情况下为 11, 不过这应该交由 Hand 类负责，而不是交给下面这个类)。 

1 public class Black]ackHand extends Hand<Black3ackCard> { 

2 /* 在二十一点况法中，一手牌 T 以有多种分数，因为 

3 • Ace 具有多个 数值 . 若低于 21 就返回最高的分数， 

4 * 若高过 21 就返回最低的分数 •/ 

5 public int score 0 { 

6 ArrayList<Integer> scores ■ possibleScores(); 

7 int maxUnder ■ Integer.MIN_VALUE; 

8 int minOver * Integer.MAX_VALUE; 

9 for (int score : scores) { 

10 if (score > 21 && score < minOver) { 

11 minOver ■ score; 

12 } else if (score <■ 21 && score > maxUnder) { 

13 maxUnder » score; 

14 } 

15 > 

16 return maxUnder ■■ Integer•MIN_VALUE ? minOver : maxUnder; 

17 > 

18 

19 /* 返印一个列表 . 色含这手牌所有 T 饒的分数 

26 * ( 将 Ace 当作 1 和 11 进行 讨算 ） */ 

21 private ArrayList<Integer> possibleScores<) { "• } 

22 

23 public boolean busted() { return score() > 21; } 

24 public boolean is21() { return score() ** 21; } 

25 public boolean lsBlack]ack() { ... } 

26 } 

27 

28 public class BlackDackCard extends Card { 

29 public Black3ackCard(int c t Suit s) { super(c, s); } 

30 public int value() { 

31 if (isAce()) return 1; 

32 else if (faceValue >= 11 && faceValue <« 13) return 10; 

33 else return faceValue; 

34 > 

35 

36 public int minValue() { 

37 if (isAce()) return 1; 

38 else return value(); 

39 } 

40 

41 public int maxValue() { 

42 if (isAce()) return 11; 

43 else return value(); 

44 } 

45 

46 public boolean isAce() { 
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return faceValue ■« 1; 

> 

public boolean isFaceCard() { 



这只是 Ace 的一种处理方式，另一种做法是创建一个继承自 Black3ackCard 的 Ace 类。 
在本书所附、可下载的代码中，提供了一个可自动执行的二十一点游戏程序。 


8.2 设想你有个呼叫中心，员工分成三个层级：接线员' 主管和经理。客户来电会先分配 
给有空的接线员。若接线员处理不了.就必须将来电往上转给主管。若主管没空或是无法处理. 
则将来电往上转给经理。请设计这个问题的类和数据结构，并实 现一个 dispatchCallO 方法. 
将客户来电分配给 第一个 有空的员工。（第66页） 


解法 

7个员 T. 层级各有各的职责，因此，不同层级会有专门的函数。我们应该将它们放在各自对 
应的类里。 

有些东西是所有员工都有的，比如地址、姓名、职位和年龄等。这些东西可以放在一个类里， 
再由其他类扩展或继承。 

最后，还应该有一个 CallHandler •类，负责将来电分派给合适的负 责人。 

注意，任何面向对象设计问题，都会有很多不同的对象设计方式。请跟面试官讨论各种设汁 
方案的优劣。通常，设计时应该从长远考虑，注重代码的灵活性和可维护性。 

下面我们将详细说明每个类。 

CallHandler 实现为一个单态类，它是程序的主体，所有来电都先由这个类进行分派。 


public clas ： 
private : 


CallHandler { 
tatic CallHandler : 


/• 三个 R 工层 级： 接紙 H 、 主管、经理 •/ 
private final int LEVELS * 3; 

/* 起始设定 10 位接线员 . 4 位主管扣 2 位经理 V 
private final int NUM_RESPONDENTS = 10; 
private final int NUM_MANAGERS = 4; 
private final int NUM_DIRECTORS = 2; 

/* 工列表，以层级 区分： 

* employeeLevels[6] = 接线 fi 

* employee Levels [ 1 ]= 主管 

* employeeLevels[2]= 经理 
*/ 

List<List<Enployee» employeeLevels; 

/* 存放来电层级的队列 

callQueues; 
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21 

22 protected CallHandlerO { ••• } 

23 

24 /* 取得草态类的实例 V 

25 public static CallHandler getlnstance() { 

26 if (instance == null) instance = new CallHandlerO; 

27 return instance; 

28 > 

29 

30 I ， 找出第一个有空处理来电的 》 工 */ 

31 public Employee getHandlerForCall(Call call) ( ... } 

32 

33 /* 将来电分派给有空的 R 工，若没人有空， 

34 * 就存放在队列中 •/ 

35 public void dispatchCall(Caller caller) { 

36 Call call * new Call(caller); 

37 dispatchCall(call); 

38 > 

B9 

40 /* 将来电分 fc 给有空的 Hi, 若没人有空， 

41 * 就存放在队列中 •/ 

42 public void dispatchCall(Call call) { 

43 /* 试着将表电分派给层鈒最低的 B 工 V 

44 Employee emp » getHandlerForCall(call) ; 

45 if (enp l> null) { 

46 emp.recelveCall(call); 

47 call.setHandler(emp); 

48 } else { 

49 /* 根拢来电鈒别，将来电放到相应的 

50 • 队列 t •/ 

51 call.reply("Please wait for free employee to reply**); 

52 callQueues[call.getRank().getValue()].add(call); 

53 > 

54 > 

55 

56 /• 有员工有空了，全找该工可级务的来 t. 

57 * 若分派了来电則返田 true, 蒼 則返回 false V 

58 public boolean assignCall(Employee enp) {... > 

59 > 

Call 代表客户来电，每次来电会有个最低层级,并且会被分派给第一个可处理该来电的员工。 

1 public class Call { 

2 /* 吁处理此来电的最低展級 R 工 */ 

B private Rank rank; 

4 

5 /* 拨号方 V 

6 private Caller caller; 

7 

8 I* 处理来电的 《 工 */ 

9 private Employee handler; 

10 

11 public Call(Caller c) { 

12 rank = Rank.Responder; 
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13 caller = c; 

14 > 

15 

16 /* 设定处理来免的 Ri */ 

17 public void setHandler(Employee e) { handler = e; } 

18 

19 public void reply(String message) { _ } 

20 public Rank getRank() { return rank; > 

21 public void setRank(Rank r) { rank = r; } 

22 public Rank incre«entRank() { ... } 

23 public void disconnect) { ... } 

24 } 

Employee 是 Director、Manager 和 Respondent 类的父类，由于没有必要直接实例化 Employee 
类，因此是个抽象类。 

1 abstract class Employee { 

2 private Call currentCall - null; 

3 protected Rank rank; 

4 

5 public Employee() { } 

6 

7 /• 开始交诙对请 */ 

8 public void receiveCall(Call call) {... > 

9 

10 /* 问题解决了，東来兔 •/ 

11 public void callCompleted() { .•• } 

12 

13 /* 问题禾解决，往上柃给史高层級的 H 工， 

14 * 并为该 B 工分派新的来电 */ 

15 public void escalateAndReassign() { ••• } 

16 > 

17 

18 /• 分派新的来电给该 R 工，若他有空的谘 

19 public boolean assignNewCall() { ... } 

20 

21 I ，返田该 H 工是否有空 •/ 

22 public boolean isFree() { return currentCall ■■ null; } 

23 

24 public Rank getRank() { return rank; } 

25 > 

26 

有了 Employee 类， Respondent、Director 和 Manager 只是在此基础上稍微扩展一下。 

1 class Director extends Employee { 

2 public Director() { 

3 rank s Rank.Director; 

4 > 

5 > 

6 

7 class Manager extends Employee { 

8 public Manager() { 

9 rank = Rank.Manager; 
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13 class Respondent extends Employee { 

14 public Respondent() { 

15 rank = Rank.Responder; 


上面只是此题的一种设计方式。注意，其实还有其他许多同样不错的方法。 

在面试中.要写这么多代码似乎有点可怕.确实如此。这里给出的代码比较完整，在实际面 
试中，可能不箱要写得这么全，有些细节可以先简略带过，等到有时间了再作补充。 

8.3 运用面向对象原则，设计一軟音乐点唱机。（第66页） 

解法 

但凡遇到面向对象设计的问题，一开始就要向面试官问几个问题，以便 M 淸设计时有哪些限 
制条件。这台点唱机放的是 CD 吗？是唱片？还是 MP 3? 它是计算机模拟软件，还是代表一台实 
体点唱机？播放音乐要收钱还是免费？收钱的话，要求哪 N 货币？可以找零吗？ 

遗憾的是，这里没有面试官，我们无法与之对话。因此，下面将作出一些假设。假设这台点 
唱机为计算机模拟软件，与实体点唱机非常相像.另外，假定播放音乐是免费的。 

至此尘埃落定，下面将列出基本的系统 组件： 

□ 点唱机 （Jukebox ); 

□ CD ; 

□ 歌曲 （ Song ); 

□ 艺术家 （ Artist ); 

□ 播放列表 （ Playlist ); 

□ 显示屏 （ Display , 在屏幕上显示洋细信息） 9 
接下来，进一步分解上述组件，考虑吋能的动作。 

□ 新建播放列表 （ 包括新增、删除和随机播放） 

□ CDj £ 择器 
□ 歌曲选择器 

□ 将歌曲放进播放队列 
口获取播放列表中的下一首歌曲 
另外，还可引人 用户： 

□ 添加； 

□ 删除； 

□ 信用信息。 

每个主要系统组件大致都会转换成一个对象，而每个动作则转换为一个方法。下面将介绍一 
种可行的设计。 
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] U keb 0 X 类代表此题的主体，系统各个组件之间或系统与用户间的大量交互，都是通过这个 
类实琬的。 

1 public class Jukebox { 

2 private CDPlayer cdPlayer; 

3 private User user; 

4 private Set<CD> cdCollection; 

5 private SongSelector ts; 

6 

7 public Dukebox(CDPlayer cdPlayer, User user, 

8 Set<CD> cdCollection, SongSelector ts) { 

9 ... 

10 > 

11 

12 public Song getCurrentSong() { 

13 return ts.getCurrentSong(); 

14 > 

15 

16 public void setUser(User u) { 

17 this.user ■ u; 

18 > 

19 } 

跟实际 CD 播放器一样， CDPlayer 类一次只能放一张 CD 。 不在播放的 CD 都存放在点唱机里。 

1 public class CDPlayer { 

2 private Playlist p; 

3 private CD c; 

4 

5 /* 构遣戒数 */ 

6 public CDPlayer(CD c， Playlist p) { ... } 

7 public CDPlayer(Playlist p) { this.p ■ p; } 

8 public CDPlayer(CD c) { this.c - c; } 

9 

10 /• 播放歌南 V 

11 public void playSong(Song s) {...) 

12 

13 /* getter 和 setter */ 

14 public Playlist getPlaylist() { return p; } 

15 public void setPlaylist(Playlist p) { this.p * p; } 

16 

17 public CD getCD() { return c; } 

18 public void setCO(CD c) { this.c * c; } 

19 > 

Playlist 类管理 3 前播放的歌曲和待播放的下一首歌曲。它本质上是播放队列的包裹类，还 
提供了一些操作起来更方便的方法。 

1 public class Playlist { 

2 private Song song; 

3 private Queue<Song> queue; 

4 public Playlist(Song song^ Queue<Song> queue) { 
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7 



public Song getNextSToPlay() { 
return queue.peek(); 

} 

public void queueUpSong(Song s) { 
queue.add(s); 


CD 、 Song 和 User 这几个类都相当简单，主要由成员变量 、 getter (访问）和 setter ( 设置）方 
法组成。 


public I 


1 识别碼.艺术家，歌曲等 


public class Song { 

/* 识别鸹 .CD (可覲 为空） 


名称.长度等*/ 


public class User { 

I private String name; 
public String getName() 
public void setName(String nane) 
public long getID() { return 10; > 
public void setID(long ID) { ID ■ ID; 
private long ID; 

public User(String name, long ID) {. 
public User getUser() { return this; 
public static User addUser(String nam 


long iD) 


这当然绝非唯一 “正确”的实现。跟其他限制条件一样，面试官对一开始询问的回应也会影 
响点唱机里各种类的设计。 

8.4 运用面向对象原则，设计_个停车场。（第66页） 


解法 

这个问题的表述有些含糊，在实际的面试中也会出现这种情况。这就要求你与面试官交流， 
问清楚允许哪些车辆进人停车场，它是不是多层的，等等。 

为便于描述，我们先做如下假设条件。这些特定的假设条件会让问題变得更复杂，但又不致 
过于复杂。如果你想作出其他假设，那也完全不成问题。 

□ 停车场是多层的。每一层有好几排停车位。 

□停车场可停放摩托车、轿车和大巴。 

□ 停车场有摩托车车位、小车位和大车位。 

□ 摩托车可停在任意车位上。 

□ 轿车可停在单个小车位或大车位上。 

□ 大巴可停在同一排五个连续的大车位上，但不能停在小车位上。 
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在下面的实现中，我们创建了抽象类 Vehicle, 而 Car 、 Bus 和 Motorcycle 都继承自这个类。 
为处理不同大小的车位，我们用了一个类 ParkingSpot, 并以它的成员变量表示车位大小。 

1 public enum VehicleSize { Motorcycle, Compact, Large } 

2 

3 public abstract class Vehicle { 

4 protected ArrayList<ParkingSpot> parkingSpots = 

5 new ArrayList<ParkingSpot>(); 

6 protected String licensePlate; 

7 protected int spotsNeeded; 

8 protected VehicleSize size; 

9 

10 public int getSpotsNeeded() { return spotsNeeded; } 

11 public VehicleSize getSize() { return size; } 

12 

13 /* 将车锔停在这个车位里（也可能包含其他车位 > */ 

14 public void parklnSpot(ParkingSpot s) { parkingSpots.add(s); } 

15 

16 r 从车位移除车輛，并遢知车位车輛已离开 •/ 

17 public void clearSpots() { ... } 

18 

19 /* 检奩车位是否够大以停放该车輛 （ i 车位是空 的 ）. 

20 * 这只会检査车位大小，并不搶查是否有足蜱多 

21 * 的车位 V 

22 public abstract boolean canFitInSpot(ParkingSpot spot); 

23 } 

24 

25 public class Bus extends Vehicle { 

26 public Bus() { 

27 spotsNeeded ■ 5; 

28 size - VehicleSize.Large; 

29 } 

30 

31 /* 捡查车位是否为大车位，不会检查车位的数日 */ 

32 public boolean canFitlnSpot(ParkingSpot spot) { ... } 

33 } 

34 

35 public class Car extends Vehicle { 

36 public Car() { 

37 spotsNeeded => 1; 

38 size ■ VehicleSize.Compact; 

39 } 

40 

41 r 检查车位是小车位还是大车位 */ 

42 public boolean canFitlnSpot(ParkingSpot spot) { ••■ } 

43 } 

44 

45 public class Motorcycle extends Vehicle { 

46 public Motorcycle() { 

47 spotsNeeded = 1; 

48 size - VehicleSize.Motorcycle; 
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51 public boolean canFitInSpot(ParkingSpot spot) { ... } 

52 > 

ParkingLot 类本质上就是 Level 数组的包裹类。以这种方式实现，我们就能将真正寻找空车 
位和泊车的处理逻辑从 ParkingLot 里更为广泛的动作中抽取出来。要是不这么做，就需要将车 
位放在某种双数组中 （ 或将车位位于所在搂层的编号对应到车位列表的散列表 ) 。将 ParkingLot 
与 Level 分离开来，整个设计更显清晰。 

1 public class ParkingLot { 

2 private Level[] levels; 

3 private final int NUM_LEVELS - 5 ； 

4 

5 public ParkingLot() { ... } 

6 

7 /* 将该车柄停在一个车位或多个车位， 

8 * 失敵 « 返田 false V 

9 public boolean parkVehicle(Vehicle vehicle) { ... } 

10 > 

11 

12 /• 代表停车场里的一层 */ 

13 public class Level { 

14 private int floor; 

15 private ParkingSpot[] spots; 

16 private int availableSpots = 0; // 空 用车位的數量 

17 private static final int SP0TS_PER_R0W - 10; 

18 

19 public Level(int fir, int numberSpots) { … } 

20 

21 public int availableSpots() { return availableSpots; } 

22 

23 /* 找地方伴这輛车，失敗則返田 false •/ 

24 public boolean parkVehicle(Vehicle vehicle) {... > 

25 

26 /* 停放该车鷂，从车位編号 spotNumber 开始 . 

27 • 直到 vehicle. spotsNeeded •/ 

28 private boolean parkStartingAtSpot(int num. Vehicle v) {... > 

29 

30 /* 寻找车位停放这輛车 . 返回车位索幻号 . 

31 • 失敗 « 返田 -1 */ 

32 private int findAvailableSpots(Vehicle vehicle) { ••• } 

33 

34 /* 当有车麵从车位移除时，增加可用车位数 

35 * availableSpots •/ 

36 public void spotFreed() { availableSpots#; } 

37 } 

ParkingSpot 类只用一个变景表示车位的大小。我们也可以从 ParkingSpot 继承并创建 
LargeSpot, CompactSpot 和 MotorcycleSpot 等几个类来实现，但这么做未免有些小题大做。除 
了大小不一，这些车位并没有不一样的行为。 


1 public class ParkingSpot { 

2 private Vehicle vehicle; 
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3 private VehicleSize spotSize; 

4 private int row; 

5 private int spotNumber; 

6 private Level level; 

7 

8 public ParkingSpot(Level lvl, int r, int n, VehicleSize s) {•••} 

9 

10 public boolean isAvailable() { return vehicle *= null; } 

11 

12 /* 栓壹车位是否 移大、 T 用 •/ 

13 public boolean canFitVehicle(Vehicle vehicle) { ... } 

14 

15 /* 将车輛停在该车位 */ 

16 public boolean park(Vehlcle v) { ... } 

17 

18 public int getRow() { return row; } 

19 public int getSpotNumber() { return spotNumber; } 

20 

21 /* 从車位移蜍车柄.并 4 知禱 I, 

22 * 有新的车位 T 用 */ 

23 public void renoveVehicle() { ... } 

24 } 

在本书可下载的源码包中，可以找到上述代码的完整实现，包括 P 〖执行的测试代码。 

8.5 请设计在线图书阅读器系统的数据结构。（第66页） 

解法 

此题对系统功能的说明着 鼉不多 ，因此，就让我们假设要设计一个基本的在线图书阅读系统， 
提供如 K 功能。 

□ 用户成员资格的建立和延长期限。 

□ 搜索阁书数据库。 

□ 阅读书箱。 

□ 同一时间只能有一个活跃用户。 

□ 该用户一次只能看一本书。 

要实现这些操作，可能还需提供许多其他函数，比如 get 、 set 、 update , 等等。该系统的 
对象可能包括 User 、 Book 和 Library 。 

OnlineReaderSysten •类为 程序的主体，可以这么 实现： 存放所有图书的信息，管理用户， 
刷新显示画面，但是这么一来，整个类就会变得非常笨重。因此，我们转而选择将这些组件拆分 
成 Library 、 UserManager 和 Display 等几个类。 

1 public class OnlineReaderSystem { 

2 private Library library; 

3 private UserManager userManager; 

4 private Display display; 


private Book activeBook; 
private User activeUser; 
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8 

9 public OnlineReaderSystemO { 

10 userManager = new UserManager(); 

11 library = new LibraryO; 

12 display » new Display(); 

13 > 

14 

15 public Library getLibraryO { return library; } 

16 public UserManager getUserHanager() { return userHanager; } 

17 public Display getDisplay() { return display; } 

18 

19 public Book getActiveBook() { return activeBook; } 

20 public void setActiveBook(Book book) { 

21 activeBook = book; 

22 display.displayBook(book); 

23 > 

24 

25 public User getActiveUser() { return activeUser; } 

26 public void setActiveUser(User user) { 

27 activeUser ■ user; 

28 display.displayUser(user); 

29 > 

30 ) 

随后，我们实现这几个类，以处理用户管理器、 ra 书库和 a 示组件。 

1 public class Library { 

2 private Hashtable<Integer, Book> books; 

B 

4 public Book addBook(int id. String details) { 

5 if (books.containsKey(id)) { 

6 return null; 

7 > 

8 Book book = new Book(id, details); 

9 books.put(id, book); 

10 return book; 

n > 

12 

IB public boolean remove(Book b) { return renove(b.getIO()); } 

14 public boolean remove(int id) { 

15 if (Ibooks.containsKey(id)) { 

16 return false; 

17 > 

18 books.remove(id); 

19 return true; 

20 > 

21 

22 public Book find(int id) { 

23 return books.get(id); 

24 ) . 

25 } 

26 

27 public class UserManager { 

28 private HashtableKlnteger^ User> users; 







pageNumber++ 
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83 > 

84 

85 public void refreshUsername() { /* 史新用 户名的 1 示 */ } 

86 public void refreshTitle() { /* 更新 标题的 i 示 V } 

87 public void refreshDetails() { /* 更新細 节信息的農示 •/ } 

88 public void refreshPage() { /* 更新 R 面夏示 V } 

89 } 

User 和 Book 类只是存放数据，并没有什么真正的功能。 


1 public class Book { 

2 private int bookld; 

3 private String details; 

4 

5 public Book(int id« String det) { 

6 bookld » id; 

7 details ■ det; 

8 > 

9 

10 public int getID() { return bookld; } 

11 public void setID(int id) { bookld - id; } 

12 public String getDetails() { return details; > 

13 public void setOetails(String d) { details - d; } 

14 } 

15 

16 public class User { 

17 private int userid; 



用户管理、图书库和显示功能等功能本可以通通放进 OnlineReaderSystem 类中，这里却将 
它们拆分至不同的类里，这么做挺有意思的，值得探讨一番。如果一个系统很小，这么做可能会 











使系统变得过于复杂。然而，随着系统的扩展， OnlineReaderSystem 会加人越来越多的功能， 
将各个功能拆分开来，可以避免这个主类变得臃肿不堪。 

8.6 实现一 个拼图程序。设计相关数据结构并提供一种拼图霣法。假设你 有—个 fitsWith 
方法，传入两块拼图，若两块拼图能拼在 一起. 则返回 true 。 （第66页） 


解法 

假设有一套传统简单的拼图游戏.按行和列划分为网格.毎块拼图都落在某一行和某一列中， 
有四条边，每条边分为= .种： 内凹、外凸和平直。例如，角落的拼图块有两条边是平直的，另外 
两条边可能是内凹或外凸。 


□绝对 位置： “这块拼围的位 霣是 (12, 23>。” 绝对位 SIS 于 Piece 类本身.同时还包含摆放 

方向。 

□相对 位置： “我不知道这块拼图的实际位置，但知道它与另•块拼图相邻相对位 
于 Edge 类。 

我们的解法只使用相对位置.从而将相邻的边拼在一起。 

下面是一种可能的面向对象 设计： 
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17 

18 class Puzzle { 

19 Piece[] pieces; /• 判余还未拼的拼图 */ 

20 Piece[][] solution; 

21 

22 /* 麥见算 法一节 */ 

23 Edge[] inners, outers, flats; 

24 Piece[] corners; 

25 

26 /* 麥見算 法一节 V 

27 void sopt() { ... } 

28 void solveO { •••} 


拼拼图的算法 

下面我们将搭配使用伪码和实际代码，勾勒出拼拼图的算法。 

就跟小孩玩拼图游戏时一样，我们会从最简单的拼图块 人手： 四个角落和四条边上的。我们 
很容易就能从所有拼图块中找出直边的。拼图的时候，不妨将拼阁块按边缘类型分组，这或许是 
个不错的选择。 

1 void sopt() { 

2 for each Piece p in pieces { 

3 if (p has two flat edges) then add p to comers 

4 for each edge in p.edges { 

5 if edge is inner then add to inners 

6 if edge is outer then add to outers 


如此一来，给定某一边，我们可以更快速地挑出可能拼合在一起的拼图块。然后一行一行地 
检査拼图，找出可 拼在一 起的拼 图块。 

下面实现的 solve 方法会随意挑选一个角落开始拼图，找出这个角落还没拼上的一边，然后 
试着找出可拼在一起的拼阁块。找到相符的拼阁块以后，执行如下操作。 

(1) 与边缘衔接起来。 

(2) 从未接好的边缘列表中移除该边缘。 

(3) 找到下一条未接好的边缘 o 

如果当前边缘的•边还未接好，则下一条未接好的边缘即为该边缘。如果该边缘已接好，则 
下一条边可以是任意其他边缘。这会让拼拼图时看起来像是从外向内的螺旋状。 

呈螺旋状的原因是，只要可以的话，该算法总是以直线移动。当抵达第一边缘的末端时，算 
法会移至角落拼图块唯一可用的边缘，也就是旋转90度。每到边缘的末端就会旋转90度，直到拼 
图外圈边缘全部拼完。当最后一块边缘的拼图块拼好后，该拼图块只剩一条边没接好，于是再次 
旋转90度。在后续每一圈中，该算法会重复同样的流程，直至所有拼图块都拼好为止。 

下面是该算法的类似 Java 的伪码实现。 
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1 public void solve() { 

2 /* 随便选个角落开始拼 S */ 

3 Edge currentEdge = getExposedEdge(corner[0]); 

4 

5 /* 循环会以蟫旋状进行迭代， 

6 • 直到拼图完成为止 */ 

7 while (currentEdge !* null) { 

8 /* 以相反的边緣类塑进行掛图，内凹对外6,等等 •/ 

9 Edge[] opposites - currentEdge.type == inner ? 

10 outers : inners; 

11 for each Edge fittingEdge in opposites { 

12 if (currentEdge.fitsWith(fittingEdge)) { 

13 attachEdges(currentEdge, fittingEdge); // 衔 接边緣 

14 reffloveFromList<currentEdge); 

15 removeFroinList (fittingEdge); 

16 

17 /* 取出下一条边緣 V 

18 currentEdge * nextExposedEdge(fittingEdge); 

19 break; // 觥出内展循环，鱸缝外层 M 坏 

20 > 

21 ) 

22 > 

23 > 

24 

25 public void removeFronList(Edge edge) { 

26 if (edge.type ■■ flat) return; 

27 Edge[] array - currentEdge.type ― inner ? inners : outers; 

28 array.remove(edge); 

29 > 

30 

31 /* T 以 的诱，返 W 对边的边緣，否 «. 

32 * 返 W 任意还夂接好的边緣 V 

33 public Edge nextExposedEdge(Edge edge) { 

34 int next_index = (edge.index * 2) % 4; // 对边 

35 Edge next_edge - edge.parent.edges[next_index]; 

36 if isExposed(next_edge) { 

37 return next_edge; 

38 > 

39 return getExposedEdge(edge.parent); 

40 } 

41 

42 public Edge attachEdges(Edge el t Edge e2) { 

43 el.attached_to - e2; 

44 e2.attached.to * el; 

45 } 

46 

47 public Edge isExposed(Edge el) { 

48 return edge.type != flat && edge.attached_to « null; 

49 } 

50 

51 public Edge getExposedEdge(Piece p) { 

52 for each Edge edge in p.edges { 

53 if (isExposed(edge)) { 

54 return edge; 
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57 return null; 

58 > 

为了简单起见，我们将 inners 和 outers 表示为一个 Edge 数组。但这并不是个好设计，因为 
需要频繁添加和删除数组元素。在实际代码开发中，我们可能会用链表来实现这些变量。 

对面试来说，要写出此题的完整代码，实在太多了。通常，面试官可能只会要求你勾勒代码 
的轮廓。 


8.7 请描述该如何设 计一个聊天服 务器。要求给出各种后台组件' 类和方法的细节，并说 
明其中最难解决的问题会是什么。（第66页） 

解法 

设计聊天服务器是项大工程，绝非一次面试就能完成。毕竞，就算一整个团队，也要花费数 
月乃至好几年才能打造出一个聊天服务器。作为求职者，你的 T 作是专注解决该问题的某个方面， 
涉及范围要够广，又要够集中，这样才能在一轮面试中搞定。它不一定要与真实情况一模一样， 
但也应该忠实反映出实际的实现。 

这里我们会把注意力放在用户管理和对话等核心 功能： 添加用户，创建对话、更新状态，等 
等。考虑到时间和空间有限.我们不会探讨这个问题的联网部分，也不描述数据是怎么真正推送 
到客户端的。 

另外，我们假设“好友关系”是双向的，如果你是我的联系人之那就表示我也是你的联 
系人之一。我们的聊天系统将支持群组聊天和一对一（私密）脚天，但并不考虑语音聊天、视频 
聊天或文件传输。 

1. ® 要支持哪些特定动作？ 

这也有待你跟面试官探讨，下面列出几点想法。 

□ 显示在线和离线状态。 

□ 添加请求（发送、接受、拒绝)。 

口更新状态信息。 

□ 发起私聊和群聊。 

□ 在私聊和群聊中添加新信息。 

这只是一部分列表，如果时间有富余，还可以多加一些动作。 

2. 从这些需求可了解到什么？ 

我们必须掌握用户、添加请求的状态.在线状态和消息等概念。 

3. 系统有哪些核心组件？ 

这个系统可能由一个数据库、一组客户端和一组服务器组成。我们的面向对象设计不会包含 
这些部分，不过可以讨论一下系统的整体概览。 

数据库将用来存放更持久的数据，比如用户列表或聊天对话的备份。 SQL 数据库应该是不错 
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的选择，或者，如果可扩展性要求更高，可以选用 BigTable 或其他类似的系统。 

对于客户端和服务器之间的通信，使用 XML 应该也不错。尽管这种格式不是最紧凑的（你 
也应该向面试官指出这一点），它仍是很不错的选择，因为不管是计算机还是人类都容易辨识。 
使用 XML 可以让程序调试起来更轻松，这一点非常重要。 

服务器由一组机器组成，数据会分散到各台机器上，这样一来，我们可能就必须从一台机器 
跳到另一台机器。如果可能的话，我们会尽量在所有机器上复制部分数据，以减少査询操作的次 
数。在此，设计上有个重要的限制条件，就是必须防止出现单点故障。例如，如果一台机器控制 
所有用户的登录，那么，只要这一台机器断网，就会造成数以百万计的用户无法登录。 


4.有哪些关键的对象和方法？ 

系统的关键对象包括用户、对话和状态消息等，我们已经实现了 UserManagement 类。要是 
更关注这个问题的联网方面或其他组件，我们就可能转而深入探究那些对象。 


/* UserManager 用作核心用户动作的控制中心 •/ 
public class UserManager { 

private static UserManager instance; 

/* 从用户识别 码块射 鈉用户 V 

private HashMap<Integer 4 User> usersByld; 

r 从帐户 名映射 到用户 V 

private HashMap<String # User> usersByAccountNane; 

/• 从用户识 則码块 舶到在 ft 用户 
private HashMap<Integer i User> onlinellsers; 

public static UserManager getlnstance() { 
if (instance *■ null) instance ■ new UserManager(); 



public void addUser(User fromUser, String toAccountName) { 
public void approveAddRequest(AddRequest req) { ••• } 
public void rejectAddRequest(AddRequest req) { ... } 
public void userSignedOn(String accountName) { ... } 
public void userSignedOff(String accountName) {... > 


在 User 类中， receivedAddRequest 方法会通知用户 B ( User B ), 用户 A (User A ) 请求加 
他为好友。用户 B 会接受或拒绝该请求（通过 UserManager • approveAddRequest 或 
rejectAddRequest ), UserManager 则负责将用户互相添加到对方的通讯录中 0 

当 UserManager 要将 AddRequest 加人用户 A 的请求列表时，会调用 User 类的 sentAddRequest 

方法。综上，整个流程如下。 

(1) 用户 A 点击客户端软件上的“添加用户”，发送给服务器。 


(2) 用户 A 调用 requestAddUser(User B ) 0 

(3) 步骤2的方法会调用 UserManager . addUser 。 

(4) UserManager 会调用 User A .sentAddRequest 和 User B . receivedAddRequest 0 
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重申一下,这只是设计这些交互的其中一种方式。但这不是唯一的方式,甚至也不是唯一“好” 
的做法。 

1 public class User { 

2 private int id; 

3 private UserStatus status = null; 

4 

5 /* 将其他参与的用户识别码峡射到对活 •/ 

6 private HashMap<Integer, PrivateChat> privateChats; 

7 

8 r 将群聊识别码块射到群聊 */ 

9 private ArrayList<GroupChat> groupChats; 

10 

11 /* 将其他人的用户识别碎玦射到加入请求 */ 

12 private HashMap<Integer, AddRequest 〉 receivedAddRequests; 

13 

14 /* 将其他人的用户识别鴒玦射到加入请求 •/ 

15 private HashMap<Integer f AddRequest> sentAddRequests; 

16 

17 /• 将用户识别码映射 #■! 加入请求 •/ 

18 private HashMap<Integer , User> contacts; 

19 

20 private String accountName; 

21 private String fullName; 

22 

23 public User(int id # String accountNa_e, String fullName) { ... } 

24 public boolean sendMessageToUser(User to. String content){...) 

25 public boolean sendHessageToGroupChat(int id. String cnt){.. 

26 public void setStatus(UserStatus status) {... > 

27 public UserStatus getStatus() { ... } 

28 public boolean addContact(User user) { ... } 

29 public void receivedAddRequest(AddRequest req) { •••} 

30 public void sentAddRequest(AddRequest req) {... > 

31 public void renoveAddRequest(AddRequest req) { ••• } 

32 public void requestAddUser(String accountNane) {... > 

33 public void addConversation(PrivateChat conversation) { ... } 

34 public void addConversation(6roupChat conversation) { ... } 

35 public int getld() { ... } 

36 public String getAccountNa_e() {... > 

37 public String getFullName() { ... } 

38 } 

Conversation 类实现为一个抽象类，因为所有 Conversation 不是 GroupChat 就是 
PrivateChat, 同时每个类各有自己的功能。 

1 public abstract class Conversation { 

2 protected ArrayList<User> participants; 

3 protected int id; 

4 protected ArrayList<Message> messages; 

5 

6 public ArrayList<Message> getHessages() { ... } 

7 public boolean addMessage(Message m) { ... } 

8 public int getld() { ... } 
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11 public class GroupChat extends Conversation { 

12 public void renoveParticipant(User user) { ••• } 

13 public void addParticipant(User user) { ... } 

14 > 

15 

16 public class PrivateChat extends Conversation { 

17 public PrivateChat(User userl. User user2) { 

18 public User getotherParticipant(User priaary) { ... } 

19 } 

20 

21 public class Message { 

22 private String content; 

23 private Date date; 

24 public Message(String content. Date date) { ... } 

25 public String getContent() { ... } 

26 public Date getDate() { ... } 

27 } 

AddRequest 和 UserStatus 两个类比较简单，功能不多，主要用来将数据聚合在一起，方便 
其他类使用。 

1 public class AddRequest { 

2 private User fromUser; 

3 private User toUser; 

4 private Date date; 

5 RequestStatus status; 

6 

7 public AddRequest(User from. User to. Date date) { ... } 

8 public RequestStatus getStatus() {... > 

9 public User getFronUser() { ... } 

10 public User getTol)ser() { ... } 

11 public Date getDate<) { ... } 

12 > 

13 

14 public class UserStatus { 

15 private String message; 

16 private UserStatusType type; 

17 public UserStatus(UserStatusType type. String message) { ... } 

18 public UserStatusType getStatusType() {...) 

19 public String getMessage() { ... } 

20 ) 

21 

22 public enum UserStatusType { 

23 Offline, Away, Idle, Available, Busy 

24 } 

25 

26 public enum RequestStatus { 

27 Unread, Read, Accepted, Rejected 

28 > 

在本书可下载的完整源码中，可以査看这些方法的更多细节，包括上述方法的具体实现。 

5. 最难解决或最有意思的问题是什么？ 

下面这些问题可能有点意思，不妨与面试官深入探讨一番。 
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问題丨：如何确定某人在线——我指的是真的、真的知道？ 

虽然希望用户在退出时通知我们，但即便如此也无法确切知道状态。例如，用户的网络连接 
可能断开了。为了确定用户何时退出，或许可以试着定期询问客户端，以确保它仍然在线。 

问题2:如何处理冲突的信息？ 

部分信息存储在计算机内存中，部分则存储在数据库里。如果两者不同步有冲突，那会出什 
么问题？哪一部分是“正确的”？ 

问题3:如何才能让服务器在任何负载下都能应付自如？ 

前面我们设 计明天 服务器时并没怎么考虑可扩展性，但在实际场景中必须予以关注。我们需 
要将数据分散到多台服务器上，而这又要求我们更关注数据的不同步。 

问题4:如何《防拒绝服务攻击？ 

客户端可以向我们推送数据一若它们 试阁向 服务器发起拒绝服务 （DOS) 攻击，怎么办？ 
该如何预防？ 

8.8 “奥赛罗棋”（黑白棋）的玩法如下：毎一枚棋子的一面为白， 一面 为黑。游戏双方各 
执黑、白棋子对决. 当一枚 棋子的左右或上下同时被对方棋子夹住，这枚棋子就籌是被吃掉了. 
随即翻面为对方棋子的颜色。轮到你落子时.必须至少吃掉对 方一枚 棋子。任意一方无子可落时， 
游戏即告结束。最后.棋盘上棋子较多的一方获胜。请运用面向对象设计方法.实现“奥赛罗棋”。 
(第66页） 

解法 

我们先来举个例子。假设在一盘奥赛罗棋中，有如下棋步。 

(1) 初始化棋盘，在中心位置布下两枚黑子和两枚白子„两枚黑子分别落在中心点的左上方 
和右下方。 

(2) 在@4列处落黑子，则5行4列的白子翮面变为黑子。 

(3) 在4^3列处落白子，则4^4列的黑子翻面变为白子。 

经过上面的棋步，棋盘布局如下。 
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在奥赛罗棋中，核心对象大致有游戏 （game )、棋盘 （ board )、 棋子 （ piece , 黑子或白子） 
和玩家 （ player )。 该如何用面向对象设计优雅地表示这些对象？ 


1. 该不该创建 BlackPiece 和 WhitePiece 类？ 

起先，我们可能认为自己需要从 Piece 抽象类派生出 BlackPiecelJg 和 WhitePiece 类。然而， 
这么做不见得好。每颗棋子都可以来回翻面，黑变白，内变黑，这么来看，连续不断地销毁和创 
建完全相同的对象并不明智。因此，更好的做法可能是只创建 Piece 类，并用标记指示棋子当前 
的颜色。 


2. 需要 Board 和 Game 两个独立的类吗？ 

严格来说，可能没有必要既创建 Game 对象又引人 Board 对象。不过，分别创建这两个对象可 
以从逻辑上划分棋盘 （ 只含涉及落子的逻辑 处理〉 和游戏 （ 含计时、游戏流程等〉。但是这么做 
也有弊端，我们的程序会多加几层处理，变得更复杂。有个函数可能会调用 Game 的方法，却只是 
为了让它去调用 Board 里的方法。下曲我们决定将 Game 和 Board 分开创建，不过面试时最好跟面 
试官讨论一下。 


3. 谁来记录分数？ 

很显然，我们需要某种记分方式来记录黑子和内子的数 B 。 但该由程序的哪部分来负责维护 
这些信息？不管是由 Game 抑或 Board 甚至由 Piece (在静态方法中）维护这些信息，各冇各的理 
由。我们选择交由 Board 保存这部分信息，分数在逻辑上可以算是棋盘的 部 分，由 Piece 或 Board 
调用 Board 类的 colorChanged 和 colorAdded 方法进行更新。 


4. Game 该不该实现成单态类？ 

将 Game 实现为单态类，优点在于 Game 的方法调用起来很容易，不用将 Game 对象的引用传来 

传去。 

不过，将 Game 实现成单态类也意味着它只能实例化一次，这个假设条件成立吗？在面试时， 
最好与面试官交流一下。 

下面是奥赛罗棋的一种可能设计。 

1 public enum Direction { 

2 left, right, up, down 

3 > 

4 

5 public enum Color { 

6 White, Black 

7 } 

8 

9 public class Game { 

10 private Player[] players; 

11 private static Game instance; 


private Board board; 
private final int ROWS = 10; 
private final int COLUMNS - 10; 
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15 

16 private Game() { 

17 board = new Board(ROWS, COLUMNS); 

18 players = new Player[2]; 

19 players[0] = new Player(Color.Black); 

20 players[1] = new Player(Color.White); 

21 } 

22 

23 public static Gane getlnstance() { 

24 if (instance ■■ null) instance = new Game(); 

25 return instance; 

26 > 

27 

28 public Board getBoard() { 

29 return board; 

30 > 

31 } 

Board 类负责管理棋子本身，但并不处理游戏玩法的部分，而是交由 Game 类处理。 

1 public class Board { 

2 private int blackCount » 0; 

3 private int yihiteCount = 0; 

4 private Piece[][] board; 

5 

6 public Board(int rows, int columns) { 

7 board » new Piece[rows][columns 】； 

8 > 

9 

10 public void initialize() { 

11 /* 初始化棋金中心的白子和黑子 V 

12 } 

13 

14 /* 试着将顏色为 color 的棋子放在 （ row, column ) 位罝 

15 * 成功則返田 true */ 

16 public boolean placeColor(int row, int column f Color color) { 

17 ... 

18 } 

19 

20 /* 从 （ row, column) 开始，順着方甸 d, 

21 * 将棋子翻面 V 

22 private int flipSection(int row, int column. Color color, 

23 Direction d) { ... } 

24 

25 public int getScoreForColor(Color c) { 

26 if (c ** Color.Black) return blackCount; 

27 else return whiteCount; 

28 } 

29 

30 /* 史新棋盘，有 newPieces 个棋子变为 newColor 顏色， 

31 * > 少另一种颜色的分数 •/ 

32 public void updateScore(Color newColor, int newPieces) { ••• } 

33 > 
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如前所述，我们会用 Piece 类实现黑白棋子，该类有个简单的 Color 变量，表示棋子是黑子 
还是白子。 

1 public class Piece { 

2 private Color color; 

3 public Piece(Color c) { color ■ c; } 

4 

5 public void flip() { 

6 if (color Color.Black) color * Color.White; 

7 else color ■ Color.Black; 

8 > 

9 

10 public Color getColor() { return color; } 

U > 

Player 存放的信息非常有限，甚至不会保存自己的分数，但有个方法可用来获取分数。 
Player • getScore( ) 会调用 GameManager 取得分数。 

12 public class Player { 

13 private Color color; 

14 public Player(Color c) { color - c; } 

15 

16 public int getScore() { ... } 

17 

18 public boolean playPiece(int r, int c) { 

19 return Game.getlnstanceO.getBoard().placeColor(r« c, color); 

20 > 

21 

22 public Color getColor() { return color; } 

23 > 

本书可下栽的源码包提供了完整可运行的版本。 

记住，在处理很多问题时，相比你做了些什么，你为什么这么做反而更显 s 要。面试官也许 
不会在意你是否选择将 Game 类实现为单态类.但她可能真的在乎你有没有花时间思考，有没有跟 
她讨论各种做法的优劣。 

8.9 设计一种内存文件系统 （ in-memory file system ) 的数据结构和算法.并说明具体 
做法。如有可行，请用代码举例说明。（第66页） 


解法 

许多求职者一看到这个问题，可能就会惊慌失措。文件系统太底层了吧！ 

其实，没必要惊慌。只要把文件系统的组件考虑周全，我们就能像解决其他面向对象设计问 
题那样搞定此题。 

一个最简单的文件系统由 File (文件）和 Directory (目录）组成。每个 Directory 包含一 
组 File 和 Directory 。 File 和 Directory 有很多相同特征，因此我们创建了 Entry 类，前面两个 
类则继承这个类。 

1 public abstract class Entry { 
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protected Directory parent; 
protected long created; 
protected long lastUpdated; 
protected long lastAccessed; 
protected String name; 

public Entry(String n. Directory p) { 
name - n; 
parent * p; 

created ■ Systen.currentTiaeHillis(); 
lastUpdated = Systen.currentTineHillis(); 
lastAccessed ■ Systen.currentTi>ief1illis(); 


public boolean delete() { 

if (parent ― null) return false; 
return parent.deleteEntry(this); 




























56 > 

57 

58 public int size() { 

59 int size = 0; 

60 for (Entry e : contents) { 

61 size e.size(); 

62 > 

63 return size; 

64 } 

65 

66 public int nunberOfFilesO { 

67 int count ■ 0; 

68 for (Entry e : contents) { 

69 if (e instanceof Directory) { 

70 count++; // B 彖也算作文件 

71 Directory d - (Directory) e; 

72 count d.nunberOfFiles(); 

73 } else if (e instanceof File) { 

74 count 

75 } 

76 > 

77 return count; 

78 > 

79 

80 public boolean deleteEntry(Entry entry) { 

81 return contents.remove(entry); 

82 > 

83 

84 public void addEntry(Entry entry) { 

85 contents.add(entry); 

86 > 

87 

88 protected ArrayList<Entry> getContents() { return contents; } 

89 > 

另外，我们还可以这样实现 Directory : 为文件和子目录创建不同的链表。如此一来， 
numberOfFiles () 方法就不需要再用 instanceof 运算符，所以更为简洁，不过，我们就无法轻易 
按曰期或名称对文件和目录进行排序。 

8.10 设计并实现一个敏列表，使用链接 （ BD 链表）处理碰撞冲突。（第66页） 

解法 

假设我们要实现类似 Ha S h < K , V > 的散列表。 BP , 该散列表将类型 K 的对象映射为类型 V 的 
对象。 

首先，我们或许会想到数据结构应该大致 如下： 

1 public class Hash<K, V> { 

2 LinkedList<V>[] iteas; 

3 public void put(K key, V value) { ... } 

4 public v get(K key) { … } 


9 
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注意， items 是个链表的数组，其中 ite « S [ i ] 是个链表，包含所有键映射成索引 i 的对象（也 
即在 i 处碰撞冲突的所有对象)。 

这么做看似可行，不过要下定论，还得更深人一些考虑碰撞冲突的情况。 

假设我们有个非常简单、使用字符串长度的散列函数 3 

1 public int hashCodeOfKey(K key) { 

2 return key.toStringO.length() X items.length; 

3 } 

键 jim 和 bob 都会对应到数组的同一索引，尽管这两个键并不一样。我们必须搜索整个链表， 
找出这些键对应的真正对象。但是该怎么办呢？我们在链表里存储的只有值，并不包括原先的键。 
这就是要把值和原先的键一并存储起来的原因。 

一种做法是引人一个 Cell 对象，存储键值对。在这种实现中，链表元素的类型为 Cell 。 

下面是该实现的代码。 


public class Hash<K, V> { 

private final int MAX_SIZE « 10; 

LinkedList<Cell<K, V>>[] items; 

public Hash() { 

items ■ (LinkedList<Cell<K, V»[]) new LinkedList[MAX_SIZE]; 


/* 非常非常权 W 的教列 V 
public int hashCodeOfKey(K key) { 
return key.toStringO.length() X itens.length; 


public void put(K key, V value) { 
int x * hashCodeOfKey(key); 
if (items[x] *■ null) { 

items[x] « new LinkedList<Cell<K # V>>(); 


LinkedList<Cell<K, V» collided ■ items[x]; 

/* 壷找有着栩同嫂的項日 . 若找替换掉 V 
for (Cell<K, V> c : collided) { 
if (c.equivalent(key)) { 

collided.remove(c); 
break; 


Cell<K, V> cell = new Cell<K, V>(key, value); 
collided.add(cell 〉； 


V get(K key) { 
x = ha shCodeOfKey(key). 
itens[x] == null) { 
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return null; 

> 

LinkedList<Cell<K, V» collided : 
for (Cell<K, V> c : collided) { 
if (c.equivalent(key)) { 
return c.getValue(); 


Cell 类存储布一对数据值和键。这样一来，我们就可以搜索整个链表（因碰撞冲突而建，但 
键不一样），找到对应该键值的对象。 


public class Cell<K J V> { 
private K key; 
private V value; 
public Cell(K k, V v) { 
key = k; 
value - v; 


public boolean equivalent(Cell<K, V> c) { 
return equivalent(c.getKey()); 


public boolean equivalent(K k) { 
return key.equals(k); 


public K getKey() { return key; > 
public V getValue() { return value; } 


实现散列表的另一种常见做法是使用二叉査找树作为底层数据结构。检索元素的时间复杂度 
不再是 0(1)( 不过，从技术上来说，复杂度不会是 0(1), 因为可能有很多碰撞冲突），但是这种 
做法不需要创建一个无谓的大数组，用以存储项目。 
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9.1 有个小孩正在上楼梯，楼梯有 n 阶台阶，小 孩一次 可以上1阶、2阶或3 阶。实现一 
个方法，计算小孩有多少种上楼梯的方式。（第68页） 


解法 

我们可以采用自上而下的方式来解决这个问题。小孩上楼梯的最后一步，也就是抵达第 n 阶 
的那一步，可能走1阶、2阶或3阶。也就是说，最后一步可能是从第阶往上走1阶、从第》-2 
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阶往上走2阶，或从第《-3阶往上走3阶。因此，抵达最后一阶的走法，其实就是抵达这最后三阶 
的方式的总和。 

下面是该算法的简单实现。 

1 public int countWays(int n) { 

2 if (n < 0 ) { 

3 return 0; 

4 } else if (n == 0) { 


return 1; 



return countWays(n - 1) + countWays(n - 2) + 
countWays(n - 3); 



跟斐波那契数列问题一样，这个算法的运行时间呈指数级增长（准确地说是 0(3")), 因为每 
次调用都会分支出一.次调用。这就意味着，对同一数值， countWays 会调用很多次，而这显然没 
有必要。我们可以利用动态规划加以修正。 


1 public static int countWaysOP(int n, int[] nap) { 

2 if (n < 0 ) { 

3 return 0; 

4 } else if (n ― 0) { 


return 1 ; 

> else if (»ap[n] > - 1 ) { 
return map[n]; 



map[n] ■ countWaysDP(n - 1, map) + 

countWaysDP(n - 2, map) + 

countWaysDP(n - 3, map); 

return map[n]; 


无论是否使用动态规划，注意上楼梯的方式总数很快就会突破整数 （ int 型）的上限而溢出。 
当《 = 37时，结果就会溢出。使用 long 可以撑久一点，但也不能从根本上解决问题。 


9.2 设想有个机器人坐在; fxy 网格的左上角.只能向右、向下移动。机器人从 (0,0) 到 
( XV )有多少种走法？ 

进阶 

假设有些点为“禁区”，机器人不能踏足。设计一种算法，找出4路径，让机器人从左上 
角移动到右下角。（第68页） 


解法 

我们需要数一数机器人向右尤步、向下 K 步，总共可以走出多少种路径。这条路径总共有 
尤 + y 步。 

为了走出一条路径，我们实质上要步里，选出尤步为向右移动。因此，可能路径的总 
数就是从 Ar + y 项中选 出义项 的方法总数。具体可以用下面的二项式（又称“《选 〆 ’） 表示： 
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n\ 

r!(/i-r)! 


对这个问题来说，该算式 变成: 


(X + Y\ (X + Y)\ 

{ X ) __ X\Y\ 

就算不知道二项式，你也可以自行推导出解法。 

我们可以将每条路径看作一个长度为 hy 的字符串，由 a •个 R 和 y 个 D 组成。 尤 + y 个不同的字符 
可以组成 ( AT + 10!个宇符串。不过，在这个问题中，有义个宇符为 R , y 个宇符为 D 。 R 有 V 种排列组 
合，这些组合全都一样，对 D 的情况也类似，因此必须将结果除以义!和 X !。最后可得到跟前面相 
同的 算式： 


(X + Y)\ 

x\n 


进阶： 找 S —条避开禁区点的路径 

如果把网格_出来，你会发现移动到位置 ( Y , K ) 的唯一方式，就是先移动到它的相 邻点： 
(尤-1，>0或(兄卜1)。因此，我们苗要找到一条移至 ( AT - l , y ) 或 ( A ； y -1> 的路径。 

怎么才能找出前往这些位 a 的路径呢？要找出前往或(足 y - i ) 的路径，我们溶要先移 
至其中一个相邻点。因此，要找到一条路径移动到认 - I , y ) 的相邻点，坐标为认-2,10和(尤-1,/-1), 
或 ( U - I ) 的相邻点，坐标为 ( AT - I , y -1) 和 ( U -2)。 注意，坐标 ( JT - I ， y -1> —共出现了两次；我们稍 
候再作讨论。 

因此，要找到一条从原点出发的路径，我们只需像上面那样从终点往回走。从 ft 后一点开始， 
试着找出一条到其相邻点的路径。下面是该算法的递归丈现代码。 


public boolean getPath(int x, int y, ArrayList<Point> path) { 
Point p = new Point(x # y); 
path.add(p); 
if (x 0 && y »* 0 ) { 
return true; // 找到一条路径 

> 

boolean success - false; 
if (x >« 1 M isFree(x - 1 # y)) { // 试着向左 
success = getPath(x - 1, y, path); // T 行！向左走 

> 

if (!success && y >» 1 && isFree(x, y - 1)) { // 试着向上 
success = getPath(x, y • 1, path); // T 行！甸上走 

> 

if ((success) { 

path.add(p); // 鋤了！最好不要再走这里 
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之前我们提到了重复路径的问题。要找到一条前往 ( X ， K ) 的路径，就要找出到它的相邻点 
和的路径。当然.若其中一个方格禁止通行，我们就要绕着走。接着，冉看这两 
个点的相 邻点： ( x - 2 , Y ), ( Ar - i , y - i )> ( x - i ， y - i ^( u - 2 )。 其中， （ n , y - i ) 出现了两次，也意味 
着我们做了一次无用功。理想情况下，我们应该记下先前访问过认 y - i ), 以免浪费宝贵的时间。 
下面就是运用了动态规划的算法。 

1 public boolean getPath(int x, int y, ArrayList<Point> path, 

2 Hashtable<Point > Boolean> cache) { 

B Point p = new Point(x 4 y); 

4 if (cache.containsKey(p)) { // 已访«过这个点 

5 return cache.get(p); 

6 > 

7 path.add(p); 

8 if (x 0 && y 雪 ■ 0 ) { 

9 return true; // 找列一条路技 

10 } 

11 boolean success 篇 false; 

12 if (x >■ 1 isFree(x - 1, y )) { // 试着向左 

13 success ■ getPath(x - 1, y, path, cache); // T 行！甸左走 

14 > 

15 if ((success && y >囂 1 M isFree(x, y - 1)) { // 试着由上 

16 success ■ getPath(x, y - 1 ， path, cache); // T 行！甸上走 

17 > 

18 if ((success) { 

19 path.add(p); // 儋了！最好不要再走这叉 

20 > 

21 cache.put(p 4 success); // 緩存鉍果 

22 return success; 

23 > 

只要稍作修改，就能大幅提升程序的执行速度。 

9.3 在数组 A [0... n -1] 中.有所谓的魔术索引，满足条件 A [ i ] = i 。 给定 一个有 序整数 
数组.元素值各不相同，.编写一个方法，在数组 A 中 找出一 个鼸术索引，若存在的话。 

进阶 

如果数组元素有重爱值，又该如何处理？（第68页） 


觭法 

看到这个问题，第二反应可能是选择蛮力法，这也没什么好羞愧的。我们可以直接迭代访问 
整个数组，找出符合条件的元索。 

1 public static int magicSlow(int[] array) { 

2 for (int i - 0 ; i < array.length; i++) { 

3 if (array[i] == i) { 

4 return i; 

5 > 

6 > 

7 return -1; 

8 } 
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不过，既然给定数组是有序的，我们理应充分利用这个条件。 

你可能会发现这个问题与经典的二分査找问題非常相似。充分运用模式匹配法，就能找出适 
当的算法，我们又该怎么运用二分查找法呢？ 

在二分査找中，要找出元素我们会先拿它跟数组中间的元素: c 比较，确定 m 于 x 的左边还 
是右边。 

以此为基础，是否通过检査中间元素就能确定魔术索引的位置？下面来看一个样例 数组： 


-40 

-20 

-1 

1 

2 

1 

5 

7 i 

9 

12 

13 

0 

1 

2 

3 

4 

5 

6 

M 

8 

9 

10 


看到中间元素 A [ S ] ■ 3,我们可以断定魔术索引一定在数组右侧，因为 A [ mid ] < tnid 。 
为何魔术索引不会在数组左侧呢？注意，从元素 /移至 /- I 时，此索引对应的值至少要减1,也 
可能更多（因为数组是有序的.且所有元索各不相同）。因此，如果中间元索就巳经太小而不是 
魔术索引的话，那么往左侧移动时，索引减值至少也减所有余下的元索也会太小。 

继续运用这个递归算法，就会写出与二分査找非常相似的代码。 


public static int nagicFast(int[] array, int start, int end) { 
if (end < start 丨丨 start < 0 || end >■ array.length) { 
return -1; 

> 

int mid ■ (start + end) / 2 ; 
if (array[nid] ■■ aid) { 
return mid; 

} else if (array[mid] > _id){ 
return magicFast(array, start, mid - 1); 



return magicFast(array, mid * 1 , end); 


i public static int nagicFast(int[] array) { 

• return magicFast(array, array.length - 1); 


进阶： 如果数组元素有靈 复 值又该如何处理？ 

如果数组元素有重复值，前面的算法就会失效。以下面的数组 为例: 



看到 A [ mid ] < mid 时，我们无法断定魔术索引位于数组哪一边。它可能在数组右侧，跟前 
面一样。或者，也可能在左侧（在本例中的确在左側)。 

它有没有可能在左侧的任意位置？未必。由 A [ S ] = 3可知， A [4] 不可能是魔术索引。 A [4] 
必须等于4,其索引才能成为魔术索引，但数组是有序的，故 A [4] 必定小于 A [5]。 




226 第 9 章解题技巧 


事实上，看到 A [ S ] = 3时，按照前面的做法，我们需要递归搜索右半部分。不过，若捜索 
左半部分，我们可以跳过一些元素，只递归搜索 A [ e ] 到 A [3] 的元素。 A [3] 是第一个可能成为魔 
术索引的元素。 

综上，我们得到一般 模式： 先比较 midindex 和 midValue 是否相同。然后，若两者不同，则 
按如下方式递归搜索左半部分和右半部分。 

□ 左半部分：搜索索引从 start 到 Math . niin(midlndex - 1, midValue 〉 的元素。 

□ 右半部分：搜索索引从时3价.11^(111：1(110(16\ + 1, midValue ) 到 end 的元素。 

下面是该算法的实现代码。 


public static int magicFast(int[] array, int start, int end) { 
if (end < start |j start < 0 || end >■ array.length) { 
return - 1 ; 


int midindex - (start ♦ end) / 2; 
int midValue - array[midlndex]; 
if (midValue « midlndex)( 



/* 搜索右半 _ 分 */ 

int rightIndex ■ Math.max(midlndex + 1, nidValue); 
int right « magicFast(array, rightlndex, end); 


return right; 


25 public static int magicFast(int[] array) { 

26 return magicFast(array, 0, array.length - 1); 



注意，在上面的代码中，如果数组元素各不相同.这个方法的执行动作与第一法几近相同。 


9.4 编写一个方法，返回某集合的所有子集。（第68页） 

解法 

着手解决这个问題之前，我们先要对时间和空间复杂度有个合理的评估。一个集合会有多少 
子集？我们可以这么计算，生成一个子集时，每个元素都可以“选择”在或不在这个子集中。也 
就是说，第一个元素有两个 选择： 它要么在集合中，要么不在集合中。同样，第二个元素也有两 
个选择，依此类推，2相乘^»次， {2 * 2 * … } 等于 2" 个子集。因此，在时间或空间复杂度上， 
我们不可能做得比 0(2") 更好。 
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集合办…, a»} 的所有子集组成的集合也称为幂集 (powerset), 用符号表示为句，…， 
a„))^ij\n) 0 

解法1:递归 

此题非常适合采用简单构造法。假设我们正尝试找出集合 {句，处,...,％} 的所有子集，可 
从终止条件开始。 

• 终止条件： 71 = 0 
空集合只有一个 子集： {}。 

• 情况：”=1 

集合 {<»l} 有两个子集：{}、{<»|}。 

• 情况 ： n = 2 

集合有四个子集：{}、 { a,}、 {电}、 {a.,az}. 

• 情况 ： n = 3 

至此，亊情开始变得冇点意思了。我们想找出一种方法，可以根据之前的答案产生》» = 3时的 
答案。 

u = 3和/! = 2的两个答案之间有何不同？下面让我们更细致地分析两者 差异： 

/*(2) - {}, {ai}, {<%}, {a,, a 2 ) 

P0) - {}. {oi}, {<%} ， {a\, a 2 ), [a u a 3 ), {aj, a 3 ), {ai, a 2 , a 3 ) 

两者之间的不同之处在于，所有含有勿的子集，忾 2) 都没有。 

P 0 )- P (. 2 )= { a 3 }, ( auth ), [ 02 , 03 },{ 01 , 02 , 0 3 } 

那么.我们该如何利用/ >(2) 构造忾 3)? 很简单，只笛复制 P(2 埋的子集，并在这些子集中添 
加 Oj: 

^2)={},{a,}, {a*}, { a lt a 2 ) 

P(2> + a 3 = {a 3 }, {a\, a 3 }, {a 2 , a 3 ), {a,, a 2 , a 3 ] 

两者合并在一起，即可产生/ >(3)。 

• 情况： n>0 

只要将上述步骤稍作一般化处理，就能产生一般情况的/ >(/»): 先计算复制一份结果， 
然后在每个复制后的集合中加人 
下面是该算法的实现 代码： 

1 ArrayList<ArrayList<Integer>> getSubsets(ArrayList<Integer> set, 

2 int index) { 

3 ArrayList<ArrayList<Integer>> allsubsets; 

4 if (set.size() == index) { // 终止条件，加入空集合 

5 allsubsets = new ArrayList<ArrayList<Integer>>(); 

6 allsubsets, add (new ArrayList<Integer>()); // 空集合 

7 > else { 

8 allsubsets = getSubsets(set, index + 1); 

9 int item = set.get(index); 

10 ArrayList<ArrayList<Integer” noresubsets = 
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11 new Array List <Array List<Integer» (); 

12 for (ArrayList<Integer> subset : allsubsets) { 

13 ArrayList<Integers newsubset = new ArrayList<Integer>(); 

14 newsubset.addAl1(subset); 

15 newsubset.add(itea); 

16 moresubsets.add(newsubset); 

17 > 

18 allsubsets.addAll(moresubsets); 

19 > 

20 return allsubsets; 

21 > 

这个解法的时间和空间复杂度为 0(2")， 已经是最优解。非要镩上添花的话，我们还可以迭 
代方式实现这个算法。 

解法2:组合数学 （ Combinatorics ) 

尽管上面的解法没什么地方不对，不过还是可以另觅他法，解决这个问题。 

回想一下，在构造一个集合时，每个元素有两个选择： （ 丨 ） 该元素在这个集合中 （“ yes ” 状 
态），或者 （2) 该元素不在这个集合中 （“ no " 状态)。这就意味着每个子集都是一串 yes 和 no ， 
比如 “ yes ， yes ， no , no , yes , no ” 0 

由此，总共可能会有 2” 个子集。怎样才能迭代遍历所有元索的所有 “ yes ” / “ m >” 序列？如 
果将每个 “ yes ” 视作1,每个 “ no " 视作0,那么，每个子集就可以表示为一个二进制串。 

接着，构造所有子集就等同于构造所有的二进制数（也即所有整数)。我们会迭代访问1到2” 
的所有数字，冉将这些数字的二进制表示转换成集合。小事一桩！ 

1 ArrayList < ArrayList<lntegep» getSubsets2(ArrayLlst<Integer> set) { 

2 ArrayList<ArrayList<Integer>> allsubsets ■ 

3 new ArrayLlst<ArrayLlst<Integer»(); 

4 int max * 1 << set.size(>; /• 计算 2 A n */ 

5 for (int k « 0; k < nax; k++) { 

6 ArrayList<Integer> subset « convertIntToSet(k, set); 

7 allsubsets.add(subset); 

8 } 

9 return allsubsets; 

10 > 

11 

12 ArrayList<Integer> convertIntToSet(int x, ArrayList<Integer> set) { 

13 ArrayList<Integer 》 subset = new ArrayList<Integer>(); 

14 int index = 0; 

15 for (int k - x; k > 0; k »- 1) { 

16 if ((k & 1) == 1) { 

17 subset.add(set.get(Index)); 

18 > 

19 index-t-f ； 

20 > 

21 return subset; 

22 } 

相比前一种解法，这种解法不存在实质的差异，并无上下之分。 
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9.5 编写一个方法，确定某字符串的所有排列组合0 ( 第68页） 


解法 

跟许多递归问题一样，简单构造法非常管用。假设有个字符串 S, 以字符序列 a 两… 表示。 
• 终止条件： n = 1 

S = a u 只有一种排列组合，即字符串叫。 

• 情况 ： n = 2 

S = a \ 02 , 有两种排列组合中叱和= 

• 情况：« = 3 

至此，情况变得越来越有意思。根据的排列组合，如何产生的所有排列组合呢？也 
就是说，给定 

a\Oi, aja\ 

我们需要 产生： 


010203. 0|0302, 0 ^ 1 ^, 0 2 0 ^, 0 3 0 2 0| 

这两个宇符序列的区別在于前者不含<13,而后者包含巧。那么.怎样才能根瑪/(2)生成/(3)呢？ 
很简单，将塞进 A2) 里所有字符串的任意可能位置即可。 

• 情况：«>0 

对于一般情况，我们只箱 *a 这个步骤。既然已求得/ '(/i-i) 的解，接若只要将插人这拽字 
符串的任意位置。 

具体代码如下。 

1 public static AprayList<String> getPerms(String str) { 

2 if (str ■■ null) { 

3 return null; 

4 > 

5 ArrayList<String> permutations * new ArrayList<String>(); 

6 if (str.length() ― 0 ) { // 终止条忤 

7 permutations.add( WM ); 

8 return permutations; 

9 > 

10 

11 char first « str.charAt(O); // 取得豕一 个字符 

12 String remainder = str.substring(l); // 移除豕一 个字符 

13 ArrayList<String> words = getPerms(remainder); 

14 for (String word : words) { 

15 for (int j = 0; j <= word.length(); j++> { 

16 String s = insertCharAt(Mord, first, j); 

17 permutations.add(s); 

18 > 

19 } 

20 return permutations; 

21 } 

22 

23 public static String insertCharAt(String word, char c, int i) { 

24 String start = word.substring(0， i); 
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25 String end = word.substring(i〉； 

26 return start + c + end; 

27 > 

由于将会有 n ! 种排列组合，这种解法的时间复杂度为 0( n !>, 己经是最优解。 

9.6 实现一种算法，打印 n 对括号的全部有效组合 （ BD 左右括号正确 E 对 ) 。（第68页） 

解法 

看到此题，我们的第一反应可能是运用递归法，将一对括号加进 At 1) 的解答，从而得到 A / J ) 
的解答。从直觉上看，这个方法不错。 

下面来看看《 = 3时的 答案： 

( 00 ) ((())) ()( 0 ) ( 0 )() () 0 () 

如何以》= 2时的答案为基础构建上面的结果呢？ 

( 0 ) 0 () 

我们可以在字符串最前面以及原有的每对括号里面插人一对括号。至于插人其他任意位置， 
比如字符串的末尾，都会跟之前的情况重复。 

综上，可得到以下 结果： 

(0) -> (00) /* 在个左枋寺之后粬入一 对杨号 •/ 

-> ((()))/* 在个左枯号之后插 入一 对粕号 •/ 

-> ()(0) /* 在字符 ♦ 开头 福入一 对枯号 •/ 

()()•> ((>)()/• 在》1 个号之后插入一对柚号 •/ 

-> ()(0) /* 在蓽 2个左柘号之后福入一对相号 */ 

-> (>()()/* 在字符串开头祐 入一 对扯号 */ 

且慢，上而有重复的括号对组合， 0(()) 出现了两次。 

如果准备采用这种做法，那么，将字符申放进结果列表之前，必须先检査有无®复。 
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21 } 

22 return set; 

23 > 

24 

25 public String insertInside(String str, int leftIndex) { 

26 String left - str.substring(0, leftlndex + 1>; 

27 String right = str.substring(leftIndex + 1, str.length()); 

28 return left + M () M + right; 

29 } 

这种做法可行，但效率不太高，在排査重复字符串上浪费 了大量 时间。 

另一种解法是从头开始构造字符串，从而避免出现重复字符串。在这个解法中，逐一加人左 
括号和右括号，只要字符串仍然有效（合乎题意)。 

每次递归调用，都会有个索引值向字符串的某个字符。我们需要选择左括号或右括号，那么， 
何时可以用左括号，何时可以用右括号呢？ 

(1) 左 括号： 只要左括号还没有用完，就可以插人左括号。 

(2) 右 括号： 只要不造成语法错误，就可以插人右括号。何时会出现语法错误？如果右括号 
比左括号还多，就会出现语法 错误。 

因此，我们只需记录允许插人的左右括号数目。如果还有左括号可用，就插人一个左括号然 
后递归。如果右括号比左括号还多（也就是使用中的左括号比右括号还多），就插人一个右括号 
然后递归。 

1 public void addParen(ArrayList<String> list, int leftRem, 

2 int rightRem, char[] str, int count) { 

3 if (leftRem < 0 11 rightRem < leftRem) return; // 无效状态 

4 

5 if (leftRem » 0 && rightRem ― 0) { /• 没有掊号可用了 •/ 

6 

7 

8 

9 

10 
11 
12 

13 

14 

15 

16 

17 

18 

19 

20 
21 } 

22 

23 public ArrayList<String> generateParens(int count) { 

24 char[] str = new char[count*2]; 

25 ArrayList<String> list = new ArrayList<String>(); 

26 addParen(list, count, count, str, 0); 

27 return list; 

28 } 


String s * String.copyValueOf(str); 
list.add(s); 

} else { 

/* 若还有左托号 T 用， « 加入一个左杨号 */ 
if (leftRem > 0) { 



addParen(list, leftRem - 1, rightRem, str, count + 1); 


/* 若字符串是有效的 . 則加入右松号 V 
if (rightRem > leftRem) { 
str[count] ® f )*; 

addParen(list, leftRem, rightRem - 1, str, count + 1); 
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因为我们是在宇符串的每一个索引对应位置插人左括号和右括号，而且绝不会重复索引，所 
以，可以保证每个宇符串都是独一无二的。 

9.7 编写 函数. 实现许多图片编辑软件都支持的“填充颜色”功能。 给定一 个屏幕（以二 
维数组表示，元素为颜色值)、一个点和一个新的颜色值，将新颜色值填入这个点的周围区域， 
直到原来的颜色值全都改变。（第69页） 

解法 

首先，想象一下这个方法是怎么回事。假设要对一个像素 （ 比如绿色）调用 paintFill (也 
即点击阁片编辑软件的填充颜色），我们希望颜色向四周“渗出"。我们会对周围的像索逐一调用 
paintFill , 向外扩张，一旦碰到非绿色的像素就停止填充。 

我们可以递归方式实现这个 算法： 

1 enum Color { 

2 Black, Mhite, Red, Yellow, Green 

3 > 

4 

5 boolean paintFill(Color[][] screen, int x t int y. Color ocolor, 

6 Color ncolor) { 

7 if (x < 0 11 x >■ screen[0].length || 

8 y < 0 II y >■ screen.length) { 

9 return false; 


注意 screenMM 中 x 和 >■ 的顺序，碰到阁像问题时切记这一点。因为 x 表示水平轴（也即自左 
向右），实际上对应于列数而非行数。 y 的值等于行数。在面试以及平时写代码时，这个地方也很 
容犯错 0 

9.8 给定数置不限的硬币，币值为25分、10分、5分和1分，编写代码计算 n 分有几 
种表示法。（第69页） 

解法 

这是个递归问题，我们要找出如何利用较早的答案（也就是子问题的答案）计算出 

makeChange(n) 0 
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假设》=100,我们想要算出100分有几种换零方式。这个问题与其子问题之间有何关系呢？ 

我们知道100^换零后会包含0、1、2、3或4个25分硬币 （ quarter ), 因此： 

makeChange(100) » 

makeChange(100, 使用 0 个 25 分 竣 +> ♦ 
makeChange(100. 使用 1 个 25 分硬币 ）♦ 
makeChange(100, 使用 2 个 25 分硬 +) + 
makeChange(iee, 使用 3 个 2S 分硬予 i ♦ 
makeChange(iee. 使用 4 个 2 S 分 校千〉 

仔细观察一番，芎以看出其中有些问題简化掉了。举个例子， makeChange (100, 使用1 个 25 
分硬币）与 makeChange ( 7 S , 使用_25分硬币）等价。这是因为，如果给100分换零时只准用1个25 
分硬币，那么，我们就只能选择给余下的75分换零。 

同样的逻辑也适用于 makeChange (100， 使用2个25分硬币）、 makeChange (100, 使用3个25分 
硬币）和 makeChange (100, 使用4个25分硬币）。综上，前面的算式可简 化为： 

makeChange(100) - 

makeChange(100, 使用 0 个 25 分校申 > + 
makeChange(75, 使用 0 个 25 分攻予 > + 
makeChange(50. 使用 0 个 25 分硬 + 
makeChange(25. 使用 0 个 25 分 硬辛） + 

1 

注意最后一行， makeChange (100, 使用4个 2 S 分 硬币） 等于1。我们把这叫作“完全简化”。 

接下来呢？我们已经用完了25分硬币，现在可以开始使用下一个币值最人的 硬币： 10分硬 
币 （dime ) 0 

前面使用25分硬币的做法同样吋以套用在10分硬币上，但需要套用在上面算式五部分中的四 
个部分，且每一部分都要套用。第一部分的套用结果 如下： 

makeChange(100. 使用 0 个 25 分竣承 > ■ 

makeChange(100. 使用 e 个 2S 分校+、 0 个 10 分校 f > + 
makeChange(100. 使用 0 个 2S 分嫂 + . 1 个 10 分碎币 > + 
makeChange(100, 使用 0 个 25 分校千、 2 个 10 分校币 > + 

makeChange(100, 使用 0 个 25 分校 +、10 个 10 分硬予〉 

makeChange(75, 使用 0 个 25 分硬 f > ■ 

nakeChange(75. 使用 0 个 25 分嫂申 .0 个 10 分硬申 ）♦ 
makeChange(75. 使用 0 个 2S 分硬辛， 1 个 10 分硬吊） + 
nakeChange(75, 使用 0 个 25 分嫂吊 . 2 个 10 分嫂申 ）+ 

makeChange(75, 使用 0 个 25 分硬申， 7 个 10 分硬中） 

makeChange(50. 使用 0 个 2S 分螋币 ） = 

makeChange(50, 使用 0 个 25 分硬吊 .0 个 10 分硬千） + 
makeChange(50, 使用 0 个 25 分硬申， 1 个 10 分破币） + 
makeChange(50, 使用 0 个 25 分硬辛、 2 个 10 分硬辛 i ♦ 

makeChange(50, 使用 0 个 2S 分硬 +、5 个 10 分枝予） 
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makeChange(25. 使用 0 个 25 分硬辛 ） = 

makeChange(25. 使用 0 个 25 分硬 0 个 10 分螋申 > ♦ 
makeChange(25, 使用 0 个 25 分 螋币、 1 个 10 分校币 〉 ♦ 
makeChange(25. 使用 0 个 2S 分破 承 . 2 个 10 分 硬吊） 

开始使用5分镍币 （ nickd ) 时.上面算式的每一部分都要逐一展开，最终会得到一个树状递 
归结构，其中每次调用都会展开为4个或更多调用 = 

递归的终止条件就是完全简化的算式。举个例子. makeChange (50. 使用0个25分硬币、 S 个 
10分硬币)会被完全简化为1,因为5个10分硬币就等于50^。 

由上述说明可导出类似如下的递归 算法： 



上面的算法只适用于美国币值，不过，只要稍加修改扩允，就能用于其他的币值组合。 


9.9 设计一种算法.打印八皇后在 8 x 8 棋盘上的各种摆法，其中每个皇后都不同行、不同 
列，也不在对角社。这里的 ••对 角线”指的是所有的对角线，不只是平分整个棋盘的那两条对 
角线。（第69页） 

解法 

我们必须在 8 x 8 棋盘上排好8 个 皇后， 毎个 皇后都位于不同行、不同列，且不在同•对角线上。 
由此可知，每一行、每一列以及对角线只能使用一次。 

想象一下最后放到棋盘 t 的那个皇后，这里假设是在第8行。（这么假设没有问题，因为这些 
皇后怎么摆放都没关系。）这个皇后要摆在第8行的哪一格呢？ 一共有8种选择，每一列代表一种 
可能。 
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“摆好"八皇后的棋盘.其中一种摆法 


因此，欲知八皇后在以8棋盘上的所有可能摆法，具体算法 如下: 


八直后在 8x8 棋盘上的《法= 

八皇后在 8x8 棋盘上的福法， 
八史后在 8x8 棋蠱上的《法， 
八直后在 8x8 棋盘上的接法， 
八直 >6在 8x8 棋蠱上的擯法， 
八直后在 8x8 棋盘上的接法， 
八直后在 8x8 棋盘上的《法， 
八皇后在 8x8 棋盘上的接法， 
八直后在 8x8 棋皇上的《法， 


且其中一个直后位于 （ 7, 0) ♦ 
A 其中一个直后位于 （ 7, 1) ♦ 
•fl ■ 其中一个直后位于 （ 7, 2) ♦ 
儿其中一个立后位于 <7, 3) ♦ 
■H ■ 其中一个直后位于 （ 7, 4) + 
且其中一个直后位于 （ 7, S) ♦ 
i 其中 一个立 后位于 （ 7, 6) + 
i 其中一个直后位于 （ 7, 7 〉 


接着，运用非常类似的方法计箅其中的每 一项: 


八直后在 8x8 棋螽上 的《法，且其中一个皇后位于 （ 7, 3) ■ 

八直后在一 .. 的 描法， 且其中内个直后位于 （ 7, 3) 和 （ 6, e> ♦ 

八皇后在一 •• 的 《法，且其中 两个克 后位于 （ 7, 3) 和 （ 6, 1> ♦ 

八直后在一的《法，且其中两个立后位于 （ 7, 3) 和 （ 6, 2) ♦ 

八直 后在一 . 的《法， i 其中甬个皇后位于 （ 7, 3> 和 （ 6, 4> ♦ 

八 J1 后在一的《法， i 其中内个 J1 后位于 （ 7, 3) 和 （ 6, 5> + 

八史后在一的攉法， i 其中 两个皇 后位于 （ 7, 3 〉和 （ 6, 6> ♦ 

八叟后在一的《法， i 其中两个直后位于 （ 7, 3) 和 （ 6, 7> 

注意，我们不必考虑皇后位于格子 (7, 3) 和 (6, 3) 的组合情况，因为这与所有皇后不同行、 
不同列且不在对角线上的要求不符。 

接下来，具体实现也就相当简单了。 


1 int 6RID_SIZE - 8; 

2 

3 void placeQueens(int row. Integer[ 】 columns, 

4 ArrayList<Integer[]> results) { 

5 if (row ■■ 6RID_SIZE) { // 找釣 有效的《法 

6 results.add(columns.clone()); 

7 } else { 

8 for (int col * 0; col < GRID—SIZE; coLh>> { 

9 if (checkValid(columns, row, col)) { 

10 columns [row] = col; // 接放直后 

11 placeQueens(row + 1, columns, results); 

12 } 

13 > 

14 > 
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17 /* 检查 （ rowl, colunnl) 可否摆放皇后，做法是 

18 * 检查有无其他皇后位于同一列或对角线 ，不必 

19 * 检查是否在同一行上 . 因为调用 placeQueen 时， 

20 * 一次只会播放一个皇后，由此可知，这一行是 

21 * 空的 */ 

22 boolean checkValid(Integer[] columns 4 int rowl, int colunnl) { 

23 for (int row2 = 0; row2 < rowl; row2++) { 

24 int colunn2 s columns[row2]; 

25 /* 检查 （ row2, column2> 是否会让 （ rowl, columnl)t 成无效 

26 * « 放位置 V 


/* 检查同一列有无其他皇后 
if (colunnl ■■ column2) { 
return false; 


r 检查对 角线： 若两列的茈离等于 
* 兩行的茈离，軋表示兩个皇后在 
* W — 对角线上 */ 

int colunnDistance s Hath.abs(colunn2 - columnl); 


/* rowl > row 2 , 不用取絶对值 */ 
int roMOistance ■ roMl - roM2; 
if (columnDistance ■■ rowOistance) { 
return false; 


return true; 


注意.每一行只能摆放一个皇后，因此+需要将棋盘储存为完整的 8 x 8 矩阵，只箱一维数组, 
其中 columns [ r ] ■ c 表示有个皇后位于行 r 列 c 。 


9.10 给 你一堆 n 个箱子，箱子宽 w ,、 高 h ,、 深 d ,。 箱子不能翻转，将箱子堆起来时， 
下面箱子的宽度、高度和深度必须大于上面的箱子。实现一个方法，搭出最 高的一 堆箱子，箱 
堆的高度为每个箱子高度的总和。（第69页） 

解法 

要解决此题，我们需要找到不同子问題之间的关系。 

假设我们有以下这些 箱子： buH 能够堆出的最高箱堆的高度等于 max ( 底部为仏的最 
高箱堆，底部为/> 2 的最高箱堆，…，底部为心的最高箱堆)。也就是说，只要试着用每个箱子作为箱 
堆底部并搭出可能的最高高度，就能找出箱堆的最高高度。 

但是，该怎么找出以某个箱子为底的最高箱堆呢？具体做法与之前的完全相同。我们会试着 
在第二层以不同的箱子为底继续堆箱子，如此反复。 

当然，我们只需尝试有效的箱子，也就是说， 若卜大于 b t ， 那就不必尝试这么堆 箱子： {匕, 
心…},因为 h 不能放在下面。 
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下面是该算法的递归实现代码。 


public ArrayList<Box> createStackR(Box[] boxes, Box bottom) { 
int max_height » 0 ; 

ArrayList<Box> max 一 stack = null; 
for (int i = 0; i < boxes.length; i++) { 
if (boxes[i].canBeAbove(botton)) { 

ArrayList<Box> new_stack = createStackR(boxes i boxes[i]); 
int newjieight = stackHeight(new_stack); 
if (new_height > max_height) { 
max_stack * new.stack; 
max_height « new_height; 


•f (max_stack ■■ null) { 
nax_stack - new ArrayList<Box>(); 


if (bottom !- null) { 
max_stack.add( 0 , bottom); // 插入箱堆底部 


I •.述代码的问题是效率太低，我们可能已经找出以&为底的圾优解，但还是尝试找到类似{6 3 , 
/> 4 ，… } 的最佳解决方案。我们不必像之前那样从零开始构造这些答案，完全可以运用动态规划， 
缓存这些结果。 
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至此，要解决这个问题，只需反复套用这些递归关系即可 。（注意： 为了避免代码行不必要 
的回绕，以及确保代码的可读性，下面的代码使用了非常短的变量名。） 

1 public int f(String exp, boolean result, int s, int e) { 

2 if ( S == e) { 

B if (exp.charAt(s) ■- , 1* && result) { 

4 return 1; 

5 } else if (exp.charAt(s) •- && !result) { 

6 return 1 ; 


int c ■ 0 ; 
if (result) { 

for (int i * s + 1 ; i <* e; i ♦* 2 ) { 
char op - exp.charAt(i); 
if (op ― { 

c f(exp, true, s, i • 1〉 • f(exp, true, i 

> else if (op «{ 

c +■ f(exp, true, s, i - 1 ) • f(exp, false, 
c 4 - f(exp, false, s, i - 1 ) * f(exp, true, 
c f(exp, true, s, i - 1 ) • f(exp, true, i 

> else if (op ―… 

c f(exp, true, s, i - 1 ) * f(exp, false, 
c +■ f(exp, false, s, i - 1 ) • f(exp, true. 


> f(exp, false, 

> f(exp, true, s 
t f(exp, false, 
if (op « 

» f(exp, false, 
if (op « …） 

I f(exp, true, s 
: f(exp, false. 


-1) * f(exp, true, i 
• 1) • f(exp, false, i 
-1) • f(exp, false， 

-1) * f(exp, false, 

-1) • f(exp, true， i 
- 1 ) • f(exp, false. 


虽然这么做可行，但不是很有效，对于同一个 exp 的值，它会重算 f(exp) 很多次。 

要解决这个问题，我们可以运用动态规划，缓存不同表达式的结果。注意，我们需要根据 
expression 和 result 进行缓存。 

1 public int f(String exp, boolean result, int s, int e i 

2 HashMap<String, Integer〉 q) { 
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return q.get(key); 


if (s == e) { 

if (exp.charAt(s) ■■ • 

return 1; 

} else if (exp.charAt(s) : 
return 1; 

> 

return 0; 


: true) 


f e J && result 


int c » 0; 
if (result) • 
for (int i 
char op 
if (op 


23 

24 


30 

31 


s + 1; i <- e; i + 
exp.charAt(i); 

•• { 

f(exp,true,s,i-l,q) • 
else if (op « ，|’> { 
c f(exp,true,s,i-l,q) * 
c f(exp,false,s,i-l,q) 
c +■ f(exp,true,s,i-l,q) • 
else if (op » fA, ) { 
c +■ f(exp,true,s,i-l,q) • 
c +■ f(exp,false,s,i-l,q) 


else { 

for (int 1 ■ s -f 1; 1 <■ e; i + 
char op - exp.charAt(i); 
if (op == { 

c f(exp,false,s,i-l,q) 
c f(exp,true,s,i-l,q) • 
c +■ f(exp,false,s,i-l,q) 

} else if (op — r | J ) { 
c +■ f(exp,false,s,i-l,q) 

> else if (op — rA, ) { 
c +- f(exp,true,s,i-l,q) * 
c +■ f(exp,f 


f(exp,true,l-fl,e,q); 

f(exp,false,i+l,e,q); 
* f(exp,true,i+l,e,q); 
f(exp,true,i+l,e,q); 

f(exp,false,i-fl,e,q); 
'f(exp,true,i+l,e,q>; 


'^(exp,true,i-fl,e,q); 
f(exp,false,i+l,e,q 〉； 

• f(exp,false,i+l,e,q); 

■ f(exp,false,i+l,e,q); 

f(exp,true,i+l,e,q); 

'f(exp,false,i+l,e,q); 


46 q.put(key, c); 

47 return c; 

48 } 

运用动态规划后，虽然该算法已得到很好的优化，但还不够最优。要是知道一个表达式有多 
少种括号的放法，我们完全可以借由 total ( exp ) • f(exp - true ) 来算出 f(exp = false ) 0 
对于一个表达式有几种括号的放法，的确有个公式解，只是你可能不知道罢了。这个解可由 
卡塔兰数导出，其中 n 为运算符的 数目： 


C.= 


(2n)\ 
(n + l)!«! 


经过这次调整，实现代码类似 如下： 
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1 public int f(String exp, boolean result, int s, int e, 

2 HashHap<String, Integer 〉 q 〉 { 

3 String key * + s + e; 

4 int c * 0; 

5 if (!q.containsKey(key)) { 

6 if (s ■■ e) { 

7 if (exp.charAt(s) *= C 1 J ) c « 1; 

8 else c ■ 0; 

9 > 

10 

11 for (int i « s + 1; i <- e; i ♦- 2) { 

12 char op = exp.charAt(i); 

13 if (op =* *&，） { 

14 c +■ f(exp,true,s,i-l,q) * f(exp,true,i+l,e,q); 

15 > else if (op ■ 囂 1，) { 

16 int left_ops - (i-l-s)/ 2 ; // 松号 在左边 

17 int right_ops « (e - i - 1) / 2; // 托号在右边 

18 int total_ways - total(left_ops) * total(right_ops 〉； 

19 int total_false ■ f(exp,false,s,i-l,q> * 

20 f (exp, false, i-fl^e.q); 

21 c += total_ways - total_false; 

22 > else If (op — tA9 ) { 

23 c +■ f(exp,true,s,i-l,q) * f(exp,false,i+l,e,q); 

24 c f(exp,false,s,i-l,q) • f(exp,true,i+l,e,qj; 

25 } 

26 > 

27 q.put(key, c); 

28 } else { 

29 c ■ q.get(key); 

30 > 

31 if (result) { 

32 return c; 

33 > else { 

34 int nun_ops ■ (e - s) / 2; 

35 return total(nun_ops) - c; 

36 } 

37 > 
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10.1 假设你正在搭建某种服务.有多达1000个客户端软件会调用该服务，取得每天盘后 
股票价格信患（幵盘价、收盘价' 最高价与最低价)。假设你手里已有这些数据，存储格式可自 
行定义。你会如何设计这套面向客户端的服务,向客户端软件提供信息？你将负贵该服务的研发、 
部署、持续监控和维护。描述你想到的各种实现方案.以及为何推荐采用你的方案。该服务的实 
现技术可任选，此外，可以选用任构机制向客户雜分发信患。（第72页） 

解法 

从此题描述来看，我们要关注的是如何真正地将信息分发给客户端。在此假定有一些脚本可 
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以神奇地把信息收集起来。 

首先，让我们想一想合乎要求的方案应该具备哪几方面， 

□ 客户端软件易 用性： 我们希望这套服务对客户端实现起来又容易又好用。 

□让我们自己实现起来也 轻松： 这套服务应该是越容易实现越好，不该自讨苦吃，把不必 
要的工作强加到自己头上。之所以要考虑这点，不仅是因为研发成本，还有维护成本。 

□ 灵活应对未来 需求： 此题的问法是“在现实世界中你会怎么做”，因此.我们应该从解决 
实际问题的角度来思考。理想情况下，我们不想受到实现的过多限制，以致无法灵活应 
对条件或需求变更。 

□ 扩展性和 效率： 关注实现方案的效率，才不会让服务负担过重。 

有了这些注意事项，我们就可以考虑各种方案了。 

方案1 

-种选择是，将数据直接保存在纯文本文件中，让客户端通过某种 FTP 服务器下载。从某种 
角度来说，这么做容易维护，因为可以自如地査看和备份这些文件，但需要更复杂的文件解析才 
能实现各种査询。此外，若这些文件有新增数据，可能会打乱客户端的解析机制。 

方案2 

我们可以使用标准的 SQL 数据库，比客户端直接接人。这么做有如下优点。 

□ 如箱支持新功能，这种做法提供了一种让客户端奄询和处理数据的简单方式。例如，我 
们可以轻松、高效地执行这类 査询： 返间幵盘价高于况且收盘价低于 W 的所有股票。 

□ 利用标准的数据库功能就能提供数据回滚、数据备份和各种安全保障。我们不必做无谓 
的重复性劳动，因此实现起来非常轻松。 

□客户端可以很容易地整合现有应用。在各种软件开发环境中. SQL 整合是标准功能。 

那么，使用 SQL 数据库有哪些缺点呢？ 

□ 相比我们真正需要的，它所造成的负担过重。为了提供一些信息，我们并不一定需要 SQL 
后端的所有复杂功能。 

□ 对用户来说，数据库基本不可读，因此需要多一层实现.以査看和维护数据。而这会增 
加实现成本。 

□ 安 全性： 尽管 SQL 数据库提供了非常明确的安全等级，我们还是要谨慎行事，不让客户端 
存取它们不该访问的数据。此外，即使客户端不会有“恶意”的动作，它们也可能执行 
昂贵和低效的査询，而我们的服务器将会承担这些开销。 

列出这些缺点并不表示我们不该使用 SQL 。 相反,列出它们是为了让我们对这些缺点心知肚明。 

方案3 

就分发信息而言， XML 也是一种不错的选择。采用 XML 时，数据有固定的格式和 大小： 
company name ( 公司名 ）、 open ( 开盘价 ）、 high ( 最高价 ）、 low ( 最低价 ）、 closingPrice (收 
盘价），下面是一个 XML 格式的数据样例： 
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<date value= w 2008-i0-12«> 

<company naiie= rt foo**> 

<open >126.2B</open > 
<high>130.27</high> 
<1ow>122.8B</1om> 

<closingPrice>127.30</closingPrice> 

</company> 

<company na«e* w bar M > 

<open>52.73</open> 
<high>60.27</high> 

<low>50.29</low> 

<closingPrice>54.91</closingPrice> 

</company> 

</date> 

<date value= M 2008 - 10 -ll M > . . . </date> 
'</root> 


这种做法有如下优点。 

口容易分发，也容易为机器和人类识别。这也是 XML 成为分亨和分发数据的标准数据模型 
的原因之一。 

□ 大多数语言都有执行 XML 解析的库，因此客户端实现起来也很容易。 

□ 在 XML 文件中增加新结点就可以添加新数据。这不会打乱客户端解析器（只要以正确的 
方式实现解析器)。 

□ 数据以 XML 文件格式存储，因此我们可以利用现有工具备份数据，不必自己4新做一套。 
这么做可能有以下缺点。 

□ 这种做法会向客户端发送所有信息，即使他们只需要其中一部分。这么做效率很低。 

口进行数据査询时，必须解析整个文件。 

无论采用哪种数据存储方案，我们都可以提供 Web 服务 （ 比如 SOAP ) 供客户端存取数据。 
这会在工作中多加一层，但它能够提供额外的安全性，甚至还可能使客户更易整合系统。 

话说回来，这有利也有弊，客户端将只能按我们预设或希望其采用的方式获取数据。相比之 
下，在纯 SQL 实现中，即使我们没有顼料到客户端需要査询最高股价，它们还是可以进行査询。 

那么，该采用哪种方案？这里并没有明确的答案。纯文本文件方案或许是一个糟糕的选择， 
不过，对于 SQL 或 XML 方案，不管用不用 Web 服务，你都可以摆出令人信服的理由。 

这类问题的目的不是看你能否得出“正确”答案（并没有唯一正确的答案），而是看你如何 
设计一个系统，怎么权衡利弊并做出选择。 


10.2 你会如何设计诸如 Facebook 或 Linkedln 的超大型社交网站？请设计一种算法, 
展示两个人之间的“连接关系”或“社交 路径” （比如，我-►鲍勃 — 苏珊 — 杰森―你)。 
(第73页） 

解法 

这个问题有个不错的解法，就是先移除一些限制条件，解决该问题的简化版本。 
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步骤1:简化问题——先忘记有几百万用户 

首先，让我们忘掉要应对几百万的用户，针对简单情况设计算法。 

我们可以构造一个图，每个人看作一个结点.两个结点之间若有连线，则表示这两个用户为 
朋友。 

1 class Person { 

2 Person[] friends; 

3 // 其他信息 

4 } 

要找到两个人之间的连接，可以从其中一个人开始，直接进行广度优先搜索。 

为什么深度优先搜索效果不彰呢？因为它非常低效。两个用户可能只有一度之隔，却可能要 
在他们的“子树”•屮搜索几百万个结点后，才能找到这条非常简单而直接的连接。 


步骤2:处理数百万的用户 

处理 Linkedln 或 Facebook 这种规模的服务时.不可能将所冇数据存放在•台机器上。这就意 
味着前面定义的简单数据结构 Person 并不管用，朋友的资料和我们的资料不一定在同一台机器 
上。我们要换种做法，将朋友列表改为他们 ID 的列表.并按如下方式追踪。 

(1) 针对每个朋友 1 D , 找出所在机器的位 S : int machine_index = getMachinelDForUser 
( personlD);o 

(2) 转到编号为 # machine _ index 的机器。 

(3) 在那台机器 I :,执行 ： Person friend = getPersonWithID ( person _ id); c 

下面的代码描绘了这一过程。我们定义了一个 Server 类，包含一份所有机器的列表，还有一 
个 Machine 类，代表一台单独的机器。这两个类都用了散列表，从而有效地査找数据。 

1 public class Server { 
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27 public class Person { 

28 private ArrayList<Integer 〉 friendIDs; 

29 private int personID; 

30 

31 public Person(int id) { this.personID - id; } 

32 

33 public int getID() { return personID; } 

34 public void addFriend(int Id) { friends.add(id); 


'public 

t public HashMap<Integer, Person> persons « 

> new HashMap<Integer 4 Person>(); 

> public int machinelD; 

public Person getPersonWithID(int personlO) 
i return persons.get(personID); 


其实还有更多的优化和后续问题有待讨论，下面是其中的一些想法。 


优化： 减少机器间跳转的次数 

从一台机器跳转到另一台机器的幵销很昂贵。不要为了找到某个朋友就在机器之间任意跳 
转，而是试着批处理这些跳转动作。举例来说，如果有五个朋友都在同-台机器上，那就应该一 
次性找出来。 

优化： 智能划分用户和机器 

人们跟生活在同一国家的人成为朋友的可能性比较大。因此，不要随意将用户划分到不同机 
器上，而应该尽量按闰家、城市、州等进行划分。这样一来，就可以减少跳转的次数。 

问题： 广度优先搜索通常要求•标记••访问过的结点。在这种情况下你会怎么做？ 

在广度优先搜索中，通常我们会设定结点类的 visited 标志，以标记访问过的结点。但针对此 
题，我们并不想这么做。同一时间可能会执行很多搜索操作，因此直接编辑数据的做法并不妥当。 
反之，我们可以利用散列表模仿结点的标记动作，以査洵结点 id , 看它是否访问过。 


其他扩展问题 

□在真实世界中，服务器会出故瘅。这会对你造成什么影响？ 

□ 你会如何利用缓存？ 

□ 你会一直搜索，直到图的终点（无限）吗？该如何判断何时放弃？ 

口在现实生活中，有些人比其他人拥有更多朋友的朋友，因此更容易在你和其他人之间构 
建一条路径。该如何利用该数据选择从哪里开始遍历？ 

这些只是你或者面试官可能会提出的部分扩展问题，其实还有其他许多问题可以深人讨论。 


246 第 9 章解题技巧 


10.3 给定一个输入文件，包含40亿个非负整数，请设计一种算法， 产生一 个不在该文件 
中的整数。假定你有 1 GB 内存来完成这项任务。 

进阶 

如果只有 10 MB 内存可用，该怎么办？（第73页） 

解法 

总共可能有2 32 或 4( H 乙个不同的整数，其中非负整数共 2 31 个。我们可以使用 1 GB 内存，或者 
80 {乙个比特。 

这样一来，用这80亿个比特，就可以将所有整数映射到可用内存的不同比特位，处理逻辑如下。 
⑴创建包含40亿个比特的位向量 （ BV , bit vector )„ 回想一下，位向量其实就是数组，利用 
整数（或另一种数据类型）数组紧凑地储存布尔值。每个整数可存储一串32比特或布尔值。 

(2) 将 BV 的所有元素初始化为0。 

(3) 扫描文件中的所有数字 （ mun ), 并调用 BV . set ( num , 1)。 

(4) 接着，再次从索引0开始扫描 BV 。 

(5) 返回第一个值为0的索引。 

下面的代码示范了上面的算法。 

1 long numberOflnts ■ ((long) Integer.MAX_VALUE) + 1; 

2 byte[] bitfield = new byte [(int) (numberOflnts / 8)]; 

3 void find0penNumber() throws FileNotFoundException { 

4 Scanner in ■ new Scanner(new FileReader( w file.txt w )); 

5 while (in.hasNextInt()) { 

6 int n ■ in.nextInt (); 

7 r 使用 OR 操作符设罝一个字节的蓽 n 位， 

8 * 找出 bitfield 中相对应的數字， 

9 * (例如，10将对应于字节数奴 t 索幻2 

10 * 的第2 位） */ 

11 bitfield 【n / 8】 |- 1 « (n X 8); 

12 > 

13 

14 for (int i » 0; i < bitfield.length; i-f+) { 

15 for (int j ■ 0; j < 8; j++) { 

16 /* 取回每个字节的各个比特.当发现 

17 * 莱个比特为0时，即找到相对应的值 */ 

18 if ((bitfield[i] & (1 « j)) « 0 ) { 

19 System.out.printIn (i * 8 + j); 

20 return; 

21 > 

22 } 

23 } 

24 }. 

进阶： 只能使用 10 MB 内存该怎么办？ 

对数据集进行两次扫描，就可以找出不在文件中的整数。我们可以将全部整数划分成同等大 
小的区块（稍后会讨论如何决定大小)。这里假设要将整数划分为大小为1000的区块。那么，区 
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块 Oft 表0~ 999的数字，区块1代表1000〜1999的数字，依此类推。 

因为所有数值各不相同，我们很清楚每个区块应该有多少数字，所以，扫描文件时，数一数 
0~999之间有多少个值， 1000-1 999之间有多少个值，依此 类推。 如果在某个区块内只有999个 
值，即可断定该范围内少了某个数字。 

在第二次扫描时，我们要真正找出该范围内少了哪个数字。我们可以采用先前位向量的做法， 
并忽略该范围之外的任意数宇。 

眼下，问题在于区块多大才合适？下面先定义若干变量。 

□ 令 rangeSize 为第一次扫描时每个区块的范围大小。 

□令 arraySize 表示第一次扫描时区块的个数。注意 ， arraySize = 2 32 / rangeSize , 因为 
—共有2 32 个 整数。 

我们需要为 rangeSize 选择一个值，以使第一次扫描（数组）与第二次扫描（位向量）所需 
的内存够用。 

• 第一次 扫描： 教组 

第一次扫描所筘的数组可以填人 10 MB 或大约 2 a 字节的内存中。数组中每个元素均为整数 
( int ), 而每个整数有4宇节，因此可以使用最多包含约 2 21 个元素的数组。综上，我们可以导出如 
下 式子： 

• 第二次 扫描 ： 位向量 
2 32 

arraySize =-彡 2 21 

rangeSize 



rangeSize ^ 2 

我们需要有足够的空间储存 rangeSize 个比特。我们可以将2 23 个字节放进内存，自然就能存 
放2 26 个比特。因此，可以推出如下 式子： 

2" ^ rangeSize 彡 

在这些条件下，我们有足够的空间回旋，但是如果挑选出越靠近中间的值，那么，在任何时 
候所需的内存就越少。 

下面的代码提供了该算法的一种实现。 

1 int bitsize ■ 1048576; // 2 A 20 比特 （ 2 A 17 字节〉 

2 int blockNum = 4096; // 2 A 12 

3 byte[] bitfield = new byte[bitsize/8]; 

4 int[] blocks = new int[blockNum]; 

5 

6 void findOpenNumber() throws FileNotFoundException { 

7 int starting = -1; 

8 Scanner in = new Scanner (new FileReader ( w file.txt M )); 

9 while (in.hasNextInt(>) { 

10 int n - in.nextlnt(); 
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43 


for (int i = 0 ; i < blocks.length; i++) { 
if (blocks[l] < bitfield.length * 8){ 

/* 若 value < 2 A 20, 坏么该区段里至少 
* 少了一 个致字 V 

starting = i * bitfield.length * 8; 
break; 


in ■ new Scanner(new FileReader(ile.txt**)); 
while (In.hasNextlntO) { 
int n > in.nextlnt(); 

/* 若该数字落在少数字的区玦 X, 

• 則记下该数字 */ 

if (n >* starting && n < starting ♦ bitfield.length * 8) { 
bitfield [(n-starting) / 8] |* 1 « ((n - starting) X 8); 


for (int i = 0 ; i < bitfield.length; i++) { 
for (int j - 0 ； j < 8; j4^) { 

/• 取 W 暑个芋节的各个比种，奎友現有比种为0时， 

• 找到相对应的值*/ 

if ((bitfield[i] & (1 « j)) ― 0) { 

System.out.println(i • 8 ♦ j + starting); 
return; 


紧接着，面试官可能还会问你，可用内存更少的话，又该怎么办？在这种情况下，我们会采 
用第一步骤的做法重复 扫描。 首先检査每100万个元索序列中会找到多少个整数。接着.在第一. 
次扫描时，检査每1000个元素的序列中可找到多少个整数。最后，在第=次扫描时，使用位向世 


找出不在文件中的那个数字。 


10.4 给定一个数组.包含1到 /V 的整数. /V 最大为32 000. 数组可能含有重复的值.且 
W 的取值不定。若只有 4 KB 内存可用.该如何打印数组中所有重复的元素。（第73页） 

解法 

我们有 4KB 内存可用，也就是最多可寻址 8*4* 2">个比特。注意，32〃： 111 要比32000大。我 
们可以创建含有32 00(Kh 比特的位向量，其中每个比特代表一个整数。 

利用这个位向量，就可以迭代访问整个数组，发现数组元素 vW , 就将位 u® 定为1。碰到重 
复元素时，就打印出来。 

1 public static void checkDuplicates(int[] array) { 

2 BitSet bs - new BitSet(32000); 

3 for (int i = 0; i < array.length; i++) { 

4 int num * array[i]; 

5 int num0 = nun - 1; // bitset/^0 开始，数字从 1 开始 
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if (bs.get(nume)) { 

Sy steal • out • println (nun); 
} else { 

bs.set(numO); 


class BitSet { 
int[] bitset; 

public BitSet(int size) { 
bitset ■ new int[size » 5]; // 陳以 32 


boolean get(int pos) { 

int wordNumber ■ (pos >> 5); // 味以 32 

int bitNumber = (pos & 0xlF); // 涂以 32 取余数 

return (bitset[wordNumber] & (1 « bitNunber)) 


void set(int pos) { 

int wordNumber a (pos » 5); // 味以 32 
int bitNumber » (pos & 0xlF); // 涂以 32 取余数 
bitset[wordNumber] |> 1 « bitNunber; 


!- 0； 


注意，里然此题不太难，但重要的是实现代码要写得干净利落。这也是为什么要定义位向垣： 
类来保存大型的位向 fit 。 要是面试官允许（也可能不会）.那就可以使用 Java 内置的 BitSet 类。 

10.5 如果要设计一个网络爬虫程序.该怎么邂免陷入无限循环？（第73页） 


解法 

针对此题，第一个要问自己 的是： 什么情况下才会出现无限循环？最直接的答案是，如果将 
整个网络想象成一个链接的图，图中有环就会出现无限循环。 

为了避 免无限 循环，我们只需检测有没有环。一种做法是创建一个散列表，访问过页面 v 后， 
将 hash [ v ] 设为真 （ true )。 

这种解法意味着使用广度优先搜索的方式抓取网站。每访问一个页面，我们就会收集它的所 
有链接，并将它们插人队列末尾。若发现某个页面已访问，就将其忽略。 

这个方法不错，不过访问页面 v 意味着什么？页面 v 是基于它的内容还是 URL 来定义的？ 

如果页面是根据其 URL 定义的，我们必须认识到 URL # 数可能代表完全不同的页面。例如， 
页面 www . careercup . com / page ? id = microsoft - interview-questions 与页面 www . careercup • 
com / page ? id = google - interview - questions 是完全不一样的。不过，只要 URL 参数不是 Web 应 
用识别和处理的，就可以将它附加到任意 URL 之后，而不会真的改变页面，比如，页面 
www . careercup . com ? foobar = hello 与 www . careercup . com 是一样的 0 
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“好吧，”你或许会说，“那我们就以内容定义页面。”乍一听，似乎还不错，但这并不切实可 
行。假设 careercup . com 首页的部分内容是随机生成的。每次访问首页时，它都是不同的页面吗？ 
不见得。 

现实情况是目前还没有完美的方式来定义“不同的”页面，这就是此题棘手的地方。 

一种解决方法是评估相似程度。根据内容和 URL . 若某个页面与其他页面具有一定的相似度， 
则降低抓取其子页面的优先级。对于每个页面，我们都会根据内容片段和页面的 URL , 算出某种 
特征码。 

下面我们来看看这是如何实现的。 

我们有一个数据库.储存了待抓取的一系列条目。每一次循环.我们都会选择最高优先级的 
页面进行抓取，接着执行以下步骤。 

(1) 打开该页面，根据页面的特定片段及其 URL , 创建该页面的特征码。 

(2) 査询数据库，看看最近是否已抓取拥有该特征码的页面。 

(3) 若冇此特征码的页面最近已被抓取过，则将该页面插回数据库，并调低优先级。 

(4) 若未抓取，则抓取该页面，并将它的链接插人数据库。 

根据上面的实现，我们怎么也“完不成”整个 Web 的抓取，但可以避免陷人页面循环的情况 u 
若想最终“完成"整个 Web 的抓取 （ S 然，只有当这个 “ Web ” 是诸如企业内部网那种较小的系 
统时才可行)，那么，可以设定一个保证页面一定会被抓取的 最低优 先级。 

这只是一个简化的解法，实际 h 还有许多其他同样有效的解法。这类问题更像娃你跟面试官 
之间的对话，町能引发出各种各样的讨论。事实上，针对此题的讨论很有可能引出下一题。 

10.6 给定100亿个网址，如何检测出重*的文件？这里所谓的”重复“是指两个 URL 完 
全相同。（第73页） 


解法 

100亿个网址 （ URL ) 要占用多少空间呢？如果每个网址平均长度为100个字符，每个宇 
符占4字节，则这份100亿个网址的列表将占用约4兆兆字节 （4 TBL 在内存中可能放不下那么 
多数据。 

不过，不妨假装一下，这些数据真的奇迹般地放进了内存，毕竟先求解简化的题 H 是很 
有用的做法。对于此题的简化版，只要创建一个散列表，若在网址列表中找到某个 URL , 就 
映射为 true 。 （另 种 做法是对列表进行排序，找出重复项，这需要额外耗费一些时间，但几 
无优点可言。） 

至此，我们得到此題简化版的解法，那么，假设我们手上有 4000 GB 的数据，而且无法全 
部放进内存，该怎么办？倒也好办，我们可以将部分数据储存至磁盘，或者将数据分拆到多 
台机器上。 

解法1:储存至磁盘 

若将所有数据储存在一台机器上，可以对数据进行两次扫描。第一次扫描是将网址列表拆分 



9.10 扩展性与存储限制 251 


为4000组，每组 1 GB 。 简单的做法是将每个网址 u 存放在名为 < x >. txt 的文件中，其中 x = hash ( u ) 
% 4000。也就是说，我们会根据网址的散列值（除以分组 数童取 余数）分割这些网址。这样一来， 
所有散列值相同的网址都会位于同一文件。 

第二次扫描时，我们其实是在实现前面简化版问题的 解法： 将每个文件载人内存，创建网址 
的散列表，找出重复的。 

解法2:多台机器 

另一种解法的基本流程是一样的，只不过要使用多台机器。在这种解法中，我们会将网址发 
送到机器 x 上，而不是储存至文件 < x >. txt 。 

使用多台机器有优点也有缺点。 

主要优点是可以并行执行这些操作.同时处理4000个分组^对于海 M 数据，这么做就能迅速 
有效地解决问题。 

缺点是现在必须依靠4000台不同的机器，同时要做到操作无误。这可能不太现实（特别是对 
于数据 M 更大、机器更多的情况），我们需要开始考虑如何处理机器故障。此外，涉及这么多机 
器，无疑大幅增加了系统的复杂性。 

话说冋来，这两种解法都不错，都值得与面试官讨论一番。 

10.7 想象有个 Web 服务器，实现简化版搜索引擎。这套系统有100台机器来响应搜索查 
询.可能会对另机调用 processSearch(string query ) 以得到真正的结果。响应查饲 
请求的机器是随机挑选的，因此两个同样的请求不一定 由同一 台机器响应。方法 processSearch 
的幵销根大.请设计一种缓存机制，纽存最近几次查询的结果。当数据发生变化时，务必说明该 
如何更新缓存。（第73页） 


解法 

在开始设计系统之前，必须先理解此题的真正含义。如我们所预料的，这类题目有很多细节 
都比较模糊。为了提供一个解法，我们将做出一些合理的假设，不过，你应该与面试官深入讨论 
这些细节。 

假设 

下面是针对这个解法做出的几个假设条件。基于系统设计和解题的方法，你可能还会做出其 
他假设条件。 E 住，虽然某些方法会比其他的好一些，但并没有唯一 “正确”的方法。 

□ 除了必要时往外调用 processSearch , 所有査询处理都在最初被调用的那台机器上完成。 
□ 我们希望缓存的搜索査询数量庞大（几百万)。 

□ 机器之间的调用速度相对较快。 

□ 给定査询的结果是一个有序的网址列表，每个网址关联50个字符的标题和200个字符的 
摘要。 

□最常见的查询非常热门，以至于它们总是会存在缓存中。 

重申一次，这些不是唯一的有效假设，仅是其中几个合理的假设。 


252 第 9 章解題技巧 


系统需求 

设计缓存机制时，显然我们需要支持两个主要 功能： 

□ 给定某个键，快速有效地査找 出来； 

□ 旧的数据会过期，从而让它可被新的数据取代 3 

此外，当某次査询的结果改变时，我们还必须处理缓存的更新或清除。因为有些査询非常常 
见，有可能长驻在缓存中，我们不能干等着该数据过期^ 

步播1:设计单系统的缓存 

此题有个好 解法： 先针对单台机器设计缓存。那么.又该创建什么样的数据结构.使我们得 
以轻易清除旧数据，还能高效地根据键杏找出相对应的值？ 

□使用链表可以轻易清除旧数据，只需将“新鲜”项移到链表前方。当链表超过一定大小 
时，我们可以删除链表末尾的元素。 

□ 散列表可以高效査找数据.但通常无法轻易地清除数据„ 

怎样才能做到两全其美呢？将这两种数据结构融合在一起即可，下面是具体做法。 

跟之前一样创建一个链表，每次访问结点后，这个结点就会移至链表首部。这样-来，链表 
尾部将总是包含最陈 IU 的信息。 

此外，还需要一个散列表，将査询映射为链表中相应的结点。这样不仅可以有效返回缓存的 
结果，还能将适当的结点移至链表首部， 从而 更新其“新鲜度”。 

为了说明这种方法，下面给出了缩略的缓存实现代码。本书网站提供了这些代码的完整版本。 
注意，在面试中，般不会要求你为此写出完整的代码，也不会要求你设计更大的系统。 



public class Cache { 

public static int MAX_SIZE - 10; 
public Node head, tall; 
public HashMap<String, Node〉 map; 
public int size ■ 0 ; 

public Cache() { 

map = new HashMap<String, Node>(); 


/* 将結点移至键表前方 */ 

public void moveToFront(Node node) { ... } 
public void moveToFront(String query) { ... } 

/* 从 表中移除結 A */ 

public void removeFromLinkedList(Node node) {... > 

/• 从 緩存中获取結果， 并史新 表 V 
public String[] getResults(String query) { 
if (!nap.containsKey(query)) return null; 

Node node = map.get(query); 
moveToFront(node); // 更新新鮮度 
return node.results; 
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/* 将结果锸入链表，并教列 V 

public void insertResults(String query, String[] results) { 
if (map.containsKey(query)) { // 更新值 
Node node = map.get(query); 
node.results - results; 
noveToFront(node); // 更新新鲜度 



Node node ■ new Node(query, results); 
moveToFront(node); 
map.put(query, node); 

if (size > MAX_SIZE) { 
map.remove(tail.query); 
removeFronLinkedList(tail); 


步猓 2: 扩展到多台机器 

现在，我们了解了如何设计单台机器的缓存，接下来还需了解，当査询被发送至许多不同的 
机器时，如何设计缓存。回想一下问题 描述： 不能保证某个査询一定会发送给同一台机器。 

首先.我们 X 要决定缓存跨机器共享到什么程度。有以下几种选择可供参考。 

• 选择1:每台机器都有自己的緩存 

简单的选择是每台机器都有自己的缓存。也就是说，如果 “ foo ” 在短时间内被发送给机器 1 
两次，在第二次，结果会从缓存中返回。但是，如果 “ foo ” 先发送给机器 1 然后发送至机器 2, 
则两次都会被视作全新的査询。 

这么做的优点是相对快速，因为不涉及机器之间的调用。可惜，由于许多重复査询都会被视 
作全新査询，作为优化 T 具的缓存并不是那么有效。 

• 选择2:每台机器都有一个緩存的副本 

另一个极端是.我们可以给每台机器一个缓存的完整副本。当新的条目添加至缓存时，它们 
会被发送给所有机器。包括链接和散列表在内的整个数据结构都会被复制。 

这种设计意味着常见的查询几乎总是会在缓存里，因为所有机器的缓存都是相同的。但是， 
主要的缺点是更新缓存意味着要将数据发送给斤台机器，其中况是响应集群的规模。此外，每个 
条目占用的空间是上一种做法的 MS , 因此缓存所能存放的数据要少得多。 

• 选择3:每台机器储存一部分缓存 

第三种选择是将缓存分割开，每台机器存放缓存的不同部分。然后，当机器濡要査找某次 
査询的结果时，它会算出哪一台机器持有这个值，接着请求这台机器（机器 y > 在它的缓存里査 
找该査询。 

但是，机器;怎么知道哪一台机器持有这部分散列表？ 
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—种选择是根据算式 hash ( qu e ry )% A ^ 定査询的结果。然后，机器; 只需 利用这个算式即可得 
出储存结果的机器/。 

因此，当新的査询进人机器/时，这台机器会应用上面的算式从而调用机器_/。随后，机器/ 
会从它的缓存中返回待査询的值， sX 者调用 processSearch ( q U er y ) 得到结果。机器/会更新其缓 
存，并将结果返回给机器》。 

或者，你也可以这样设计 系统： 机器_/在其当前缓存中找不到査询的结果，则直接返回 null 。 
这就要求机器/调用 processSearch , 然后将结果转发给机器_/储存。这个实现实际上会增加机器 
与机器间的调用数童，没什么优势可言。 

步嫌3:内容改变时更新结果 

回想一下，有些査询可能非常热门，以致缓存足够大的话，它们可能会永久存在缓存中。当 
某些内容改变时，我们需要通过某种机制来定期或“按需”刷新缓存的结果。 

要回答这个问题.我们需要考虑结果何时才会改变（最好跟面试官讨论一下）。结果改变的 
主要时机如下。 

(1) 网址对应的内容变了 （ 或网址对应的页面被移 除)。 

(2) 为反映贞面排名变化，搜索结果的排序也变了。 

(3) 特定金询出现了新页面。 

为了处理情况 (1) 和情况 (2), 可以另外创建一个散列表，指示哪个缓存査询与特定网址关联。 
这些缓存可以完全独立于其他缓存进行处理，并放在不同的机器上。不过，这种解法可能需要大 
世的数据。 

另外，如果数据不要求即时刷新（一般来说不需要），我们可以定期遍历每台机器上储存的 
缓存，将与吏新过的 网址相 关联的结果清除掉。 

情况 (3) 很难处理。我们可以通过解析新网址对应的内容并从缓存中清除这些单一词的査询， 
来更新单一词査询。不过，这仅能处理单一词的査询。 

情况 (3)( 或我们要处理的其他类似情况)有个不错的处理方式，就是实现缓存的“自动逾期' 
也就是说，我们会强加一个超时，任何一个査询，不管它有多热门，都无法在缓存中存放超过 x 
分钟。这将确保所有的数据都会定期刷新。 

步隳 4: 继续改进 

根据你做出的假设和想要优化的情况，这个设计还可以有不少可改进和优化之处。 

其中有个优化是更好地支持有些査询非常热门的情况。例如，假设（举个极端的例子）所有 
査询中，有1%都含有某个字符串。那么，机器/不必每次都将这个搜索请求转给机器应该只向 
j 转发一次，然后机器 i 就可以直接将结果储存在自己的缓存中。 

或者，我们还可以重新架构整个系统.根据査询的散列值而不是随机将杏询分配给某台机器 
( 由此也得到缓存的位 置)。 不过，这么做也有利有弊。 

另一个优化是针对“自动过期”机制的。按照前面的描述，这个机制会在尤分钟后清除任意 
数据。然而，相比其他数据（如历史股价），我们希望某些数据（如时事新闻）的更新更频繁， 
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可以根据主题或网址实现不同的自动逾期机制。对于后一种情况，根据页面以往的更新频度，每 
个网址会设置不同的超时值。该搜索査询的超时值是每个网址超时值的最小值。 

这只是一部分可以改进的地方。记住，这类題型并没有唯一正确的解法，其用意是让你与面 
试官论设计准则，展示你的思考方式和解題 方法。 

9.11 排序与查找 


11.1 给定两个排序后的数组 A 和 B, 其中 A 的末蹦有足够的缓冲空容纳 B。 编 写一个 
方法，将 B 合并入 A 并排序。（第77页） 


解法 

已知数组 M 端有足够的缓冲，不需要再分配额外空间。程序的处理逻辑很简单，就是逐一 
比较 A 和 B 中的元索，并按顺序插人数组，直至耗尽 A 和 B 中的所有元素。 

这么做的唯一问题是，如果将元素插入数组 A 的前端，就必须将原有的元素往后移动，以腾 
出空间。更好的做法是将元素插人数组 A 的未端，那 ffi 都是空闲的可用空间。 

下面的代码就实现了上述做法.从数组 A 和 B 的末端元素开始，将最大的元素放到数绀 A 
的末端。 


public static void merge(int[] a, int[] b, int lastA, int lastB) { 
int indexA - lastA - 1; /* 数纽 a 最后元索的索 《I */ 
int indexB - lastB - 1; /* 数纽 b 最后元索的索幻 */ 
int indexMerged = lastB + lastA - 1; /* 合并后 Ikfti 的最后元索索 */ 


/* 合并 a 和 b , 从这两个 教組的 最后元索开始 •/ 
while (indexA >■ 0 && indexB >■ 0) { 

/• 数组 a 最后元素 > 数 teb 最后元索 
if (a[indexA] > b[indexB]) { 

a [indexMerged] * a [indexA]; // 复制元索 

indexMerged--; // 史新索 

indexA--; 

> else { 

a [indexMerged] = b[indexB]; // 复 W 元素 

indexMerged--; // 史新索岑 I 

indexB--; 


/* 将数组余元索复制到适当的位置 */ 
while (indexB >■ 0 〉 { 
a[indexMerged] = b[indexB]; 
indexMerged--; 
indexB--; 


注意，处理完 B 的剩余元素后，你不需要复制 A 的剩余元素，因为这些元素已经在那里了。 
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11.2 编写一个方法.对字符串数组进行排序.将所有变位词’排在相邻的位置。（第77页） 

解法 

此题有个要求，对数组中的字符串进行分组，将变位词排在一起。注意，除此之外，并没有 
要求这些词按特定顺序排列。 

做法之一就是套用一种标准排序算法，比如归并排序或快速排序，并修改比较器 
( coraparatoi ")。 这个比较器用来指示两个字符串互为变位词就是相等的。 

检査两个词是否为变位词，最简单的方法是什么呢？我们可以数一数每个字符串中各个字符 
出现的次数，两者相同则返回 true 。 或者，直接对字符串进行排序，若两个宇符串互为变位闻， 
排序后就相同。 

比较器的实现代码如下。 



这个算法的时间复杂度为 log (/0>。 

这可能是使用通用排序箅法所能取得的最佳情况了，但实际上，并不需要对整个数组进行排 
序，只箱将变位间分组放在一起即可。 

我们可以使用散列表做到这一点，这个散列表会将排序后的单词映射到它的一个变位词列 
表。举例来说， acre 会映射到列表 { acre , race , care }。 一旦将所有同为变位词的单词分组在 
一起，就可以将它们放回到数组中。 

下面是该算法的实现代码。 

1 public void sort(String[] array) { 

2 Hashtable<String, LinkedList<String>> hash = 

3 new Hashtable<Stringj LinkedList<String>>(); 

4 

5 /* 将同为 t 位句的单分在同一組 V 

6 for (String s : array) { 

7 String key ■ sortChars(s); 

8 if (!hash.containsKey(key)) { 

9 hash.put(key^ new LinkedList<String>()); 


①由变换某个闻或短语的字母顺序构成的新的词或短语。例如， “ triangle ” 是 “ integral ” 的变位词。——译者注 
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LinkedList<String> « 
anagrams.push(s); 


hash.get(key); 


/* 将教 列表袴換为数 奴 */ 
int index = 0; 

for (String key : hash.keySet()) { 

LinkedList<String> list = hash.get(key); 
for (String t : list) { 
array[index] « t; 
index++; 


你或许看出来了.上面的算法是从桶排序法修改而来的。 

11.3 给定 一个排 序后的数组，包含 n 个整数，但这个数组已被旋转过很多次，次数不详。 
谪编写代码找出数组中的某个元索。可以假定数组元素原先是按从小到大的顺序排列的。（第 
77页） 


稱法 

你是不是觉得此题要用到二分査找法？没错。 

在经典二分査找法中，我们会将 x 与中间元索进行比较，以确定^属于左半部分还是右半部分。 
此题的复杂之处在于数组被旋转过了， 对能 有一个拐点。以下面两个数组为例： 

Arrayl: {10, 15, 20, 0, 5} 

Array2: {50, 5, 20, 30, 40} 

这两个数组的中间元素都是20,但5在其中一个数组的左边，在另一个的右边。因此，只将 ; c 
与中间元素进行比较是不够的。 

不过，如果再仔细观察一下，就会发现数组有一半 （ 左边或右边）必定是按正常顺序 （ 升序） 
排列的。因此，我们可以看看按正常顺序排列的那一半数组，确定应该搜索左半边还是右半边。 

例如，如果要在 Arrayl 中査找5,我们可以比较左侧元素 （ 10 ) 和中间元素 （ 20)。由于10< 
20,左半边一定是按正常顺序排列的。另外，由于5不在这两个元素之间.因此接下来应该捜索 
右半边。 

在 ArrayZ 中，可以看到50 > 20,因此右半边必定是按正常顺序排列的。接着査看中间元素 
(20) 和右侧元素 （40), 检查5是否落在这两个元素之间。显然5并不落在两者之间，因此接下来 
要搜索右半边。 

如果左侧元素和中间元素完全相同，比如数组 {2, 2, 2, 3, 4, 2}, 这种情况就比较复杂了。 
这里我们可以检査最右边的元素是否不同。若不同，可以只搜索右半边，否则，两边都得搜索。 

1 public int search(int a[], int left, int right, int x) { 

2 int mid = (left + right) / 2 ; 

3 if (x == a[mid]) { // 找到元素 
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4 return mid; 

5 > 

6 if (right < left) { 

7 return -1; 

8 } 

9 

10 /* 左半边或右半边必有一边是接正常順序排列， 

11 * 找出是哪一半边，然后利用按正常順序排列的 

12 * 半边，确定该搜索嘩一边 */ 

13 if (a[left] < a[«id]) { //左半边为正常轉序 

14 if (x >« a[left] && x <- a[nid]) { 

15 return search(a，left, nid - 1, x); // 搜索左半边 

16 > else { 

17 return search(a, nid + 1, right, x); // 搜索右半边 

18 > 

19 > else if (a[mid] < a[left]) { // 右半边为正常棑摩 

20 if (x >■ a[nid] && x <■ a[right]) { 

21 return search(a，nid ♦ 1 ， right，x); // 搜索右半边 

22 } else { 

23 return search(a，left, nid - 1 , x); // 搜索左半边 

24 > 

25 > else if (a[left】■■ a[mid]) { // 左半边部是玄复元索 

26 if (a[nid] !- a[rlght]) { // 若右边元索不 W, 則搜索 坏一边 

27 return search(a，nid ♦ 1， right，x); // 搜索右半边 

28 > else { // 否射， 两边都得搜索 

29 int result ■ search(a，left, mid • 1， x); // 搜索左半边 

30 if (result *■ -l) { 

B1 return search$a，_id ♦ 1 ， right, x); // 搜索右半边 

32 } else { 

33 return result; 

34 > 

35 > 

36 > 

37 return -1; 

38 > 

若所有元素都不同，则上述代码执行的时间复杂度为 0( log «)。 有很多元素重复的话，算法 
时间复杂度则为0(/»)。因为若有很多重复元素，数组 （或子 数组）的左半边和右半边往往都得 
査找。 

注意，尽管此题并不是太难理解，但要完美无瑕地实现却很难。实现时难免会犯错，不必太 
自责。因为很容易就犯差一错误和其他不易察觉的错误，所以，务必对代码进行全面彻底的测试。 

11.4 设想你 有一个 20 GB 的文件， 每一行一个字 符串。请说明将如何对这个文件进行 
排序。（第77页） 

解法 

当面试官给出 20 GB 大小的限制时，实际上在暗示些什么 ^ 就此题而言，这表明他们不希望 
你将数据全部载人内存。 

该怎么办呢？做法是只将部分数据载人内存。 
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我们将把整个文件划分成许多块，每个块 xMB ， 其中 x 是可用的内存大小。每个块各自进行 
排序，然后存回文件系统。 

各个块一旦完成排序，我们便将这些块逐一合并在一起，最终就能得到全都排好序的文件。 
这个算法被称为外部排序 （external sort ) Q 

11.5 有个排序后的字符串数组，其中散 布着一 些空字符串，编写一个方法，找出给定字 
符串的位置。（第77页） 


解法 

如果没有那些空字符串，就可以直接使用二分査找法。比较待査找字符串 str 和数组的中间 
元素，然后继续搜索下去。 

针对数组中散布一些空字符串的情形，我们可以对二分査找法稍作修改，所需的修改就是与 
mid 进行比较的地方，如果 mid 为空字符串，就将 mid 换到离它最近的非空字符串的位置。 

下面以递归方式解决此题，稍加修改，就可以迭代方式实现。本书可下载的代码里提供了迭 
代实现。 


public int searchR(String[] strings. String str, int first, 
int last) { 

if (first > last) return - 1 ; 

/* 将 mid 移到中闽 V 

int Bid ■ (last + first) / 2; 

/* 若 mid 为空字符事， 找出鸟 它最近 的非空字符串 •/ 
if (strings[mid].isEmpty()) { 
int left = mid - 1 ; 
int right ■ mid ♦ 1 ; 
while (true)( 

if (left < first && right > last) { 
return - 1 ; 

} else if (right <■ last && lstrings[right].isEmpty(>) { 
mid ■ right; 
break; 

> else if (left >■ first && !strings[left].lsEnpty()) { 
mid s left; 



right++; 

left--; 


/* 检査字符串， 如有必 要則鏃 績遂知 V 
if (str. equals (strings [mid])) { // 找到了 
return mid; 

> else if (strings [aid ]. compareTo( str) < 0) { // 搜索 右半边 
return searchR(strings, str, nid + 1 , last); 

} else { // 搜索 左半边 

return searchR(strings, str, first, mid - 1); 
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36 public int search(String[] strings ， String str) { 

37 if (strings =« null 11 str == null || str == ttM ) { 

38 return -1; 

39 } 

40 return searchR(strings, str, 0, strings.length - 1); 

41 } 

如果要査找空字符串，务必小心对待。我们该找出空字符串的位置（该操作时间复杂度为 
0(»)) ?还是应该把这种情形作为错误处理？ 

很遗憾，这里并没有正确的答案。关于这一点你应该与面试官进行讨论，只需简单地询问 -- 
下，就能表明你是个细心的程序员。 

11.6 给定 Mx / V 矩阵，毎一行、每一列都按升序排列，谲编写代码找出某元素。（第77页） 

解法 


解法1 

在第一种方法里，我们可以对每一行进行二分査找，以找到元素在哪。该矩阵有 Mf , 搜索 
每一行用时 O ( log ( A 0)， 因此这个算法的时间复杂度为 0( A / log (的)。在你开始构思更好的算法之前, 
这个算法值得向面试官一提。 

要设计一个箅法，我们先从一个简单的例子开始。 
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假设要査找元素55,该如何找出它在哪儿呢？ 

只要看看一行或一列的起始元素，我们就能开始推断待査元素的位置。若一列的起始元素大 
于55,就表示55不可能在那一列，因为起始元素是那一列的最小元素。此外，我们也可推断55 
不可能在那一列的右边，因为每一列的第一个元素从左到右依次增大。因此，若那一列的起始元 
素大于待査找的元素 x , 就能确定我们必须往那一列的左边査找。 

对于矩阵的行来说，可以套用同样的逻辑。若某一行的起始元素大于 X, 就应该往上査找。 
同样地，我们也可以从列或行的末端得出类似的结论，若某一列或行的末尾元素小于 X, 就 
必须往下（行）或往右（列）査找，这是因为末尾元素必定是最大的元素。 

下面我们可以将这些观察到的要点合并成一个解法，观察到的要点 包括： 

□ 若列的开头大于 x , 那么 t 位于该列的 左边； 

□ 若列的末端小于； c , 那么$于该列的 右边； 

口若行的开头大于； C , 那么 di 于该行的 上方； 
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□ 若行的末端小于 x , 那么 jrfi 于该行的下方。 

我们可以从任意位置开始搜索，不过，让我们从列的起始元素开始。 

我们需要从最大的那一列开始，然后向左移动，这意味着第一个要比较的元素是 
array [0][ c - l ], 其中 c 为列的数目。将各个列的开头与 : t (这里为55 ) 进行比较，就会发现 t 必定 
位于列0、列1或列2,比较至 array [0]{2] 停下来。 

这个元素不一定会在完整矩阵的某一列的末端，但会是某个子矩阵的某一列的末端。同样的 
条件一样适用， array [0][2] 的值是40,比55小，由此可知必须往下移动。 

现在，我们以下面这个子矩阵为例进行说明（灰色方格已被排除了）。 
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我们可以重复套用以上条件和流程找出55。注意，在此只能使用条件1和条件4。 
下面是这个排除算法的实现代码。 

1 public static boolean findEleMent(int[][] Matrix, int elem) { 

2 int row ■ 0; 

3 int col a matrix[e].length - 1; 

4 while (row < matrix•length && col >■ 0) { 

5 if (matrix[row][col] == elen) { 

6 return true; 

7 > else if <matrix[row][col] > elen) { 



还有别的做法，我们可以运用另一种看起来更像是二分査找法的解法。其中代硏要复杂得多, 
但也用到了很多相同的技巧。 

解法2:二分査找法 
让我们再来看个简单的例子。 
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我们希望能够充分利用矩阵行列已排序的条件，以更有效率地找到元素。因此，试着问问自 
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己，对于某个元素可能位于什么位置，这个矩阵独特的排序属性意味着什么？ 

我们知道每一行每一列都是已排序的，也就是说元素 a [ i ][ j ] 会大于位于行列0和列 /- 1 
之间的元素，并且大于位于列八行0和行 i -1 之间的元素。 

换句 话说： 

a[i][8] <= a[i][l] <- ... <= a[i]【j-l] <■ a[i][j] 
a[0][j] <- a[l][j] a[i-l][j] <- a[i][j] 

下面以图表说明，其中深灰色元素大于所有浅灰色元素。 



浅灰色元索也有 顺序： 每一个都大于它左边的元素，并且大于它上方的元素，因此，根据传 
递性，深灰色元素比色块里的其他元素都要大。 
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这意味着，若在矩阵里任意脚个长方形，其右下角的元素一定是最大的。 

同样地，左上角的元素一定是最小的。下图的顔色标示元素的大小顺序（浅灰色<深灰色< 
黑 色)： 



让我们回到原先的 问题： 假设要查找值85,若顺着对角线搜索，可找到元素35和95。利用这 
些信息可知85的位置吗？ 



85不可能位于黑色区域.因为95位于该区域的左上角，也是该方形里最小的元素。85也不可 
能位于浅灰色区域，因为35位于该方形的右下角.是该方形中最大的元素。 
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85必定位于两个白色区域之一。 

因此，我们将矩阵分为四个区域，以递归方式搜索左下区域和右上区域。这两个区域也会被 
分成子区域并继续搜索。 

注意到对角线是已排序的，因此可以利用二分査找法进行高效的搜索。 

下面是该算法的实现代码。 

1 public Coordinate findElenent(int[][] Matrix, Coordinate origin, 

2 Coordinate dest, int x ) { 

3 if ((origin.inbounds(natrix) || Idest.inbounds(Matrix)) { 

4 return null; 

5 > 

6 if (matrix[origin.row][origin.column] *■ x> { 

7 return origin; 

8 } else if (!origin.isBefore(dest)) { 

9 return null; 

10 > 

11 

12 /• 将 start 和 end 分則设为对角线的起点扣终点. 

13 * 锥陣不一定是正方形，因此对角线的终点也 

14 * T 嫌不等于 dest */ 

15 Coordinate start ■ (Coordinate) origin.clone(); 

16 int diagDist - Math.min(dest.row - origin.row, 

17 dest.coluam - origin.column); 

18 Coordinate end ■ new Coordinate(start.row -f diagDist, 

19 start•column ♦ diagDist); 

20 Coordinate p b new Coordinate^, 0); 

21 

22 /* 在对角 ft 上进行二分査找，找出第一个 

23 * 比 x 大的元索 •/ 

24 while (start.isBefore(end)) { 

25 p.setToAverage(start, end); 

26 if (x > matrix[p.roM][p.coluiRn]) { 

27 start.row ■ p.row ♦ 1; 

28 start.coluan * p.colunn ♦ 1 ; 

29 > else { 

30 end.row = p.roM - 1; 

31 end.column ® p.column - 1; 

32 } 

33 > 

34 

35 /* 将矩阵分为四个区域，搜索左下区域和 

36 * 玄上区域V 

37 return partitionAndSearch(natrix, origin, dest, start, x); 

38 } 

39 

40 public Coordinate partitionAndSearch(int[][] natrix, 

41 Coordinate origin. Coordinate dest. Coordinate pivot, 

42 int elen) { 

43 Coordinate lowerLeftOrigin « 

44 new Coordinate(pivot.row, origin.colunn); 

45 Coordinate lowerLeftDest = 

46 new Coordinate(dest.row, pivot.coluam - 1); 
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47 Coordinate upperRightOrigin = 

48 new Coordinate(origin.row, pivot.colunn); 

49 Coordinate upperRIghtDest = 

50 new Coordinate(pivot.row - 1, dest.column); 

51 

52 Coordinate lowerLeft = 

53 findElement(matrix, lowerLeftOrigin, lowerLeftOest, elem); 

54 if (lowerLeft *■ null) { 

55 return findElenent(natrix, upperRightOrigin, 

56 upperRightDest , ele«); 

57 > 

58 return lowerLeft; 

59 > 

60 

61 public static Coordinate findElenent(int[][] natrix, int x) { 

62 Coordinate origin = new Coordinate(0 > 0); 

63 Coordinate dest ■ new Coordinate(aatrix.length • 1, 

64 «atrix[e].length - 1); 

65 return findElenient(natrix, origin, dest, x); 

66 > 

67 

68 public class Coordinate implements Cloneable { 

69 public int row; 

70 public int column; 

71 public Coordinate(int r, int c) { 

72 row * r; 

73 column ■ c; 

74 > 

75 

76 public boolean inbounds(int[][] matrix) { 

77 return row >- 0 && column >■ 0 && 

78 row < Matrix.length && column < matrix[0].length; 

79 > 

80 

81 public boolean isBefore(Coordinate p) { 

82 return row <■ p.row && coluan <« p.coluan; 

83 > 

84 

85 public Object clone() { 

86 return new Coordinate(row^ column); 

87 > 

88 

89 public void setToAverage(Coordinate >iin. Coordinate max) { 

90 row = (min.row * max. tom) / 2; 

91 column = (min.colunn ♦ max.colunn) / 2; 

92 > 

93 } 

如果你读过上面所有代码，心里 会想： “ 我可没办法在面试时写出所有这些代码 !” 没错，的 
确无法全部写出。但是，你在任何面试题上的表现都会比照其他求职者进行评估，因此，如果你 
无法完整写出代码，他们也同样不能。碰到这类棘手的问题时，你未必处于不利的位置。 

将一些代码独立出来写成方法，可以增加你的亮点。例如，将 partitionAndSearch 独立出 
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来写成一个方法，想勾勒代码的轮廓就要简单许多。之后有时间的话，你可以再回头填充 
partitionAndSearch 的内容。 

11.7 有个马戏团正在设计 S 罗汉的表演节目，一个人要站在另一人的扁膀上。出于实际和 
美观的考虑，在上面的人要比下面的人矮一点、轻一点。已知马戏团每个人的高度和重置，请编 
写代码计算叠罗汉最多能叠几个人。（第 77 页） 

解法 

去掉此题的“细枝末节”，可以看出真正要考的埋目如下。 

给定一个列表，每个元素由一对项目组成。找出最长的子序列，其中第一项和第二项均以非 
递减的顺序排列。 

如果套用简单构造法（或模式匹配法），我们躭可以将此题视为如何找出数组屮的最长递增 
序列。 

1. 子 问題： 最长递增子序列 

如果元素不必保持一样（相对）的顺序，则只：对数组进行排序即可。这么-來，此题就显 
得太过简单了，因此，让我们假设元索必须保持一样的相对顺序。 

通过一个一个地观察数组元素，可以试着推导出递归算法。首先，你需要了解，就算知道了 
A [0] 到 A [ i ] 的最长递增子序列，我们也无法得知 A[i + 1] 和 A[i + 2] 的答案。这一点由下面这 
个简单的例子 可知： 

It tt ： 13, 14, 10, 11, 12 

Longest(0 through 0 )： 13 

Longest(0 through 1 )： 13, 14 

Longest(0 through 2 )： 13, 14 

Longest(0 through 3 )： 13, 14 A. 10, 11 

Longest(e through 4 )： 10, 11, 12 

如果只是试着以最新的解决方案求出 Longest (0 through 4 >和 Longest (0 through 3广就 
会找不到最优解。 

然而，我们可以换一种不同的递归解法，之前是试着找出从0到《•的元素的最 K 递增子序列， 
现在改为找出以元素館尾的最长递增子序列。继续使用上面的例子，做法 如下： 

Itfe: IB, 14, 10, 11, 12 
Longest(ending with A[0 ])： 13 
Longest(ending with A 【 l]) : 13, 14 
Longest(ending with A[2 ])： 10 
Longest(ending with A[3 ])： 10, 11 
Longest(ending with A[4 ])： ie t 11, 12 

注意，以 A [ i ] 结尾的最长子序列可以通过检查先前全部解法得出，只要将 A [ i ] 附加到最长 
且“有效”的那个序列即可，所谓“有效”是指符合 A [ i ] > list . tail 的任意序列。 

2. 真正的问题：最长递增子序列，每个元素均为一对项目 

现在，我们知道如何找出一串整数的最长递增子序列，就可以很容易地解决真正的问题，只 
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要将一列表演人员按身高排序，然后对体重套用 longestlncreasingSubsequence 算法即可。 
下面是该算法的实现代码。 





seqWithMaxLength(best_sequence, solutions[i]); 


return best_sequence; 


返田较长的片列 V 

rayList<HtWt> seqWithMaxLength(ArrayList<HtWt> seql. 
ArrayList<HtWt> seq2) { 
if (seql =; null) return seq2; 
if (seq 2 *= null) return seql; 
return seql.size() > seq2.size() ? seql : seq2; 






















9.11 排序与查找 267 


53 public class HtWt implenents Comparable { 

54 /• 声明等 */ 


/* 供 sort 方法使用 V 

public int compareTo( Object s ) { 

HtWt second = (HtWt) s; 
if (this.Ht != second.Ht) { 

return ((Integer)this.Ht).compareTo(second.Ht); 



return ((Integer)this.Wt).cofflpareTo(second.Wt); 


/* 若 this 应该棑在 other 之莳，則返田 true. 

* 注意， this.isBefore(other) 和 other.isBefore(this) 

* 两者皆为 false. 这跟 compareTo 方法不用， 

* 若 3 < b，> a •/ 

public boolean isBefore(HtWt other) { 
if (this.Ht < other.Ht && this.Wt < other.Wt) return true; 
else return false; 


这个算法的时间复杂度为0(« 2 >，确实有个算法的用时可以达到 O (/ Hog (/0), 但要复杂得多， 
不太可能在面试屮推导出来，哪怕足有提示也办不到。不过，如果你有兴趣试试这种解法，不妨 
上网搜一下，应该能搜到该解法的+少说明。 


11.8 假设你正在读 取一串 整数。毎隔一段时间.你希望能找出数字: c 的秩（小于或等于* 
的值的数目)。请实现数据结构和算法支持这些操作。也就是说，实现 tra C k(intx) 方法，每读 
入一个数字都会调用该 方法： 以及 getRankOfNumberUnt x) 方法，返回值为小于或等于 x 的元 
素个数（不包括: r 本身)。（第 77 页） 

解法 

有种相对简单的实现方式是用一个数组存放所有已排好序的元素。当有新元素进来时，我们 
需要搬移其他元素以腾出空间。这么一来， getRankOfNumber 实现起来会非常有效，只需执行二 
分査找，返回索引。 

然而，插人元素（也就是 track(int x ) 函数）将会非常低效，我们需要一种数据结构，不 
仅能在插人新元素时加以更新，还能维持相对排列顺序。二叉査找树正好适用。 

之前是要把元素插人数组，现在则要将元素插人二叉査找树。 track(int x) 方法的时间复 
杂度为 0( l 0 g n ), 其中《为树的大小（当然，前提为这棵树是平衡的)。 

要找出某个数的秩，可以执行中序遍历，并在访问结点时利用计数器记录数董。目标是找到 
x 时，计数器变量将会是小于: c 的元素的数童 3 

在査找^期间，只要向左移动，计数器变量就不会变，为什么呢？因为右边跳过的所有值都 
比 x 大。毕竟最小的元素（秩为1 ) 是最左边的结点。 


268 第 9 章解题技巧 


可是当向右移动时，我们跳过了左边的一堆元素。这些元素都比*小，因此，必须增加计数 
器的值，这个值等于左子树的元素个数。 

我们不会去计算左子树的大小（效率低），而是在加人新元素时，记录相关 信息。 

接下来将以下面的树为例说明。在下图中，括号内的数字代表左子树的结点数 M (或者，换 
句话说，该结点相对于它的子树的秩)。 



假设我们想知道24在上面这棵树中的秩，会先将24与根结点20比较，发现24位于右边。根结 
点的左子树有4个结点，再加上根结点本身.总共有5个结点小于24, W 此我们会将计数器变 fi 
counter 设为5。 

然后，将24与结点25进行比较，发现24必定位于左边。 counter 变量的值不会更新，因为我 
们并未“跳过”任何较小的结点， counter 变量的值仍为5。 

接着，将24与结点23进行比较.发现24必定位于右边。 counter 变 fl 会增加1 (变为 6), W 为 
23没有左边的结点。 

最后，我们找到24并返回 counter 值： 6。 

这个递归算法 如下： 

1 int getRank(Node node, int x) { 



5 return getRank(node.left # x) 

6 if x is on right of node 

7 return node.leftSize() + 1 ♦ getRank(node•right, x) 

8 > 

下面是完整的代码。 
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11 

12 public static int getRankOfNunber(int number) { 

13 return root.getRank(number); 

14 > 

15 

16 

17 > 

18 

19 public class RankNode { 

20 public int left_size * 6; 

21 public RankNode left, right; 

22 public int data = 0 ; 

23 public RankNode(int d) { 

24 data - d; 

25 > 

26 

27 public void insert(int d) { 

28 if (d <■ data) { 

29 if (left I■ null) lcft.insert(d); 

30 else left ■ new RankNode(d); 

31 left_size++; 

32 > else { 

33 if (right l« null) right.insert(d); 

34 else right ■ new RankNode(d); 

35 > 

36 > 

37 

38 public int getRank(int d) { 

39 if (d ■■ data) { 

40 return left_size; 

41 } else if (d < data) { 

42 if (left ■■ null) return -1; 

43 else return left.getRank(d); 

44 } else { 

45 int right_ranl< ■ right ― null ? -1 : right.getRank(d>; 

46 if (right_rank «* -1) return -1; 

47 else return left_size ♦ 1 + right_rank; 

48 > 

49 } 

50} 

注意上面的代码是怎么处理 # 在树里的情况的。我们会检査返回值是否为 -1, 当发现为 -1 
时，将它往上返回。你必须处理诸如此类情况，这很重要。 

9.12 测试 


12.1 找出以下代码中的離（可能不止 Hit ): 

1 unsigned int i; 

2 for (i = 100 ; i >= 0 ; --i) 

3 printf( w %d\n M # i): ( 第 82 頁） 
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解法 

这段代码有两处错误。 

首先，根据定义 ， unsigned int 类型的变量一定会大于或等 于零。 因此， for 循环的测试条 
件一直为真，将陷人无限循环。 

要打印100到1之间的所有整数，正确的做法是测试《_>0。如果真的想打印0,可以在 for •循环 
之后加一条 printf 语句。 

1 unsigned int i; 

2 for (i = 100 ; i > 0; --i) 

3 printf(^%d\rT, i); 

另一个需要修正的地方是用 Xu 代替% d , W 为这里打印的是 unsigned intS 变 M 。 

1 unsigned int i; 

2 for (i = 100 ; 1 > 0; --i) 

3 printf( M %u\n M , i); 

现在，这段代码会正确地打印 100 到 I 的整数序列（按降序排列）。 

12.2 有个应用 程序一 运行就 崩*. 现在你拿到了源码。在调试器中运行10次之后，你发 
现该应用毎次崩溃的位置都不一样。这个应用只 有一个 线程.并且只调用 C 标准库 函数。 究竟 
是什么样的编程错误导致程序崩溃？该如何 逐一测 试毎种错误？（第83页） 


解法 

具体如何处理这个问题要视待诊断应用程序的类型而定。不过，我们还是可以给出•些随机 
崩溃的常见原因。 

(1) 随机 变鼉： 该应用程序可能用到某个随机变 tt 或可变分世，程序每次执行时取值不定。 
具体的例子包括用户输人，程序生成的随机数，或当前时间等。 

(2) 未初始化 变量： 该应用程序可能包含一个未初始化变 ft , 在某些语言中，该变量可能含 
有任意值。这个变贵取不同值可能导致代码每次执行路径有所不同。 

(3) 内存 泄漏： 该程序可能存仵内存溢出。每次运行时引发问题的可疑进程随机不定，这与 
当时运行的进程数量有关。另外还包括堆溢出或栈内数据被破坏。 

(4) 外部 依赖： 该程序可能依赖別的应用程序、机器或资源。要是存在多处依赖，程序就有 
可能在任意位置崩溃。 

为了找出问题的原因，我们首先应该尽可能地 T 解这个应用程序。谁在运行这个程序？他们 
用它做什么？这个程序属于哪种应用？ 

此外，尽管应用程序每次崩溃的位置不尽相同，但还是有办法确定它可能与特定组件或 
场景有关。例如，有可能只是启动该应用程序而不进行其他操作时，这个程序从不崩溃。它 
只有在载人文件之后的某个时间点才会崩溃。或者，有可能每次崩溃都出现在底层组件如文 
件 I / O 上。 

要解决这个问题，消除法也许值得一试。首先，关闭系统中其他所有应用，仔细追踪资源使 
用。如果该程序有些部分珂以关掉，那就设法关掉。在另一台机器上运行该程序，看看能否重现 
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同一问题。我们可以消除（或修改）的越多，就越容易定位原因。 

此外，我们还可以借助工具检査特定情况。例如，要排査前面第二个原因.我们可以利用运 
行时工具来检査未初始化变量。 

这些问题不仅考査你解决问题的方式,还考査你头脑风暴的能力。你是否会像热锅上的蚂蚁， 
胡乱给出一些建议？抑或以合乎逻辑的、有条理的方式处理问题？希望是后者。 

12.3 有个国际象棋游戏程序使用了方法 ： boolean canMoveTo(int x , int y ), 这个 
方法是 Piece 类的 一 SB 分，可以判断某个棋子能否移动到位置 ( x , y >。 请说明你会如何测试该方 
法。(第83页) 

解法 

这个问题主要涉及两大类 测试： 极限情况测试 （ 确保有错误输人时程序不会崩溃）和一般情 
况测试。我们先从第一类测试开始。 

测试类型1:极限情况测试 

确保程序会妥善处理错误或异常输人，这意味若要检査以 T 情况： 

□ 测试*和> ■为 负数的 情况； 

□ 测 A 大 T 棋盘宽度的情况； 

□ 测试 y 大于棋盘高度的 情况； 

□ 测试一个满是棋子的 棋盘； 

□ 测试一个空或接近空的 棋盘； 

□ 测试白子远多丁•黑了•的 情况； 

□ 测试黑子远多于白子的情况。 

对于上面的错误情况，我们应该询问面试官，是要返冋 false 还是抛出异常，然后有针对性地 
进行测试。 

测试类型2: _般情况测试 

一般情况测试的涉及面要大得多。理想的做法是测试每一种可能的棋盘布局.但是棋局实在 
太多了。不过，我们还是可以合理地执行测试，尽 M 涵盖不同的棋局。 

国际象棋-共有6种棋子，我们可以测试每•种棋子，在所有可能的方向上，向其他所有棋 
子移动的情况。大致如下面的代码 所示： 

1 对4•一种棋子 a: 

2 对其他每一种棋于 b (6 种及 空白） 

3 对每一个方向 d 

4 创建有 a 的棋4 

5 将 b 放在方 lijd 上 

6 试着#动一桧•全返回值 

此题的关键在于，认识到我们不可能测试每一种可能的场景，即使有心也无力办到。相反， 
我们必须专注于最重要的部分。 
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12.4 不借助任何测试工具，该如何对网页进行负载测试？（第83页） 

解法 

负载测试 （load test ) 不仅有助于定位 Web 应用性能的瓶颈，还能确定其最大连接数。同样地， 
它还能检査应用如何响应各种负载情况。 

要进行负载测试，必须先确定对性能要求最高的场景，以及满足目标的性能衡量指标。一般 
来说，有待测 M 的对象 包括： 

口响应 时间； 

□ 吞吐量； 

□ 资源利 用率； 

□ 系统所能承受的最大负载。 

随后，我们设计各种测试模拟负载，细心测量上面的每一项。 

若缺少正规的测试工具，我们可以自行打造。例如.可以创建成千上万的虚拟用户，模拟并 
发用户。我们会编写多线程的程序，新建成千上万个线程，每个线程扮演一个实际用户，载人待 
测页面。对于每个用户，耐以利用程序来测量响应时间、数据 I/O ( 输人嫌出），等等。 

之后，还要分析测试期间收集的数据结果，并与可接受的值进行比较。 

12.5 如何測试一支笔？（第83页） 

解法 

这个问题很大程度上在于理解限制条件，并有条理、结构化地解决该问题。 

为了理解有哪些限制条件，你应该抛出一系列疑问，针对某个问题了解“谁、什么、何地、 
何时、如何以及为什么”（只要与该问题相关，越多越好)。一个好的测试人员会在着手测试之前， 
先准确了解自己要测试的是什么。 

为了说明上面这项技巧，我们来看看下面的模拟对话。 

面 试官： 你会如何测试一支笔？ 

求 职者： 我想先了解一下这支笔。谁会使用这支笔？ 

面 试官： 可能是小孩。 

求职者 ：嗯， 有意思。他们会用这支笔做什么？写字、画画还是干别的？ 

面试官：両両。 

求职者：好的，谢谢。_在哪里呢？纸张、布料还是墙壁上？ 

面 试官： 画在布料上。 

求 职者： 那么，这支笔的笔头是什么样的？签字笔还是圆珠笔？要洗得掉的，还是洗不掉的？ 
面 试官： 要求洗得掉。 

在问了很多问题之后，你可以得出如下结论。 

求 职者： 好的，综上，我理解 如下： 这支笔主要面向5〜10岁的小孩，为签字笔头，有红、 
绿、蓝、黑四色，用来両画。画在布料上并且要求洗得掉。我的理解对吗？ 
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此时，求职者面对的问題与乍看上去的问题差异很大，这种情况并不少见。实际上，许多面 
试官会故意给一个看似再清楚不过的问题（谁不知道笔是什么呢！），其实是在考査你，看你能否 
发现这个问题与最初理解的有很大差别。他们相信用户也会这么做，但用户多半是无意的。 
至此，你已经知道自己要测试的是什么，接下来该提出测试计划了。这里的关键是结构。 

想想测试对象或问题会涉及哪些方面，并以此为基础展开测试 r 这个问题涉及以下几个方面。 
□ 事实 核查： 核实这是一支签字笔，墨水颜色为要求的四种颜色之一。 

□预期 用途： 绘制，这支笔在布料上画得出来吗？ 

□预期 用途： 水洗， M 在布料上的墨迹洗得掉吗（哪怕己经过了一段时 间）？ 是用热水、 
温水还是冷水才能洗掉？ 

□ 安全性：这支笔对小孩是否安全（无毒〉？ 

□ 非预期 用途： 小孩还会怎么使用这支笔？他们可能在其他物体表面上涂鸦，因此还 X 检 
査他们的行为是否正确。他们还可能踩踏、乱扔这支笔，等等。你需要确认这支笔是否 
经受得住这些使用条件。 

记住，对于任何测试问题，你都必须澜试预期和非预期的场景。人们并不一定按照你预想的 
方式使用 产品。 


12.6 在一个 分布式银行系统中.该如何测 试一台 ATM 机？（第83页） 


解法 

对于这个问题，第一要务是厘清若干假设条件，请提出以下问理。 

□ 谁会使用 ATM 机？答案可能是“任何人”，或是“盲人"，或任意其他可能的答案。 

□他们会用 ATM 机来做什么？答案可能是“取款”、“转账”、“査询余额"，等等。 

□ 我们有什么「具来测试呢？我们可以査看代码吗？还是只能访问 ATM 机？ 

记住，好的测试人员会先确定自己要测试的是什么。 

—旦了解系统是什么样的，我们就会想着将问题分解成可测试的子部分， 包括： 

□ 登录； 

□ 取款； 

□ 存款； 

□ 査询 余额； 

□ 转账。 

我们可能要搭配使用手动和自动测试。 

手动测试会检査上述步骤的每一个环节，确保涵盖所有错误情况（余额不足、新开账户、不 
存在的账户，等等)。 

自动测试稍微复杂一点。我们会希望自动处理上述所有标准流程，还要找一些非常具体的问 
题.比如竞争条件。理想情况下，我们会设法建立一套有假帐户的封闭系统，以确保即使有人从 
不同地点快速取款和存款，他也不会多得不应得的钱，或者损失应得的钱。 

最重要的是，我们必须优先考虑安全性和可靠性。客户的帐户无时无刻都要处于被保护的状 
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态，我们必须确保账目得到正确处理。没有人希望自己的钱不翼而飞。优秀的测试人员深谙整个 
系统里哪些事项是最重要的。 

9.13 C 和 C++ 


1 3. 1用 C ++ 写个方法.打 印瑜入文件 的最后/<行 。（第88页） 

解法 

此题有一种蛮 力法： 先数出文件的行数 （ AO , 然后打印第况-/^行到第 A / 行。但是，这么做， 
文件要读两遍，会产生没必要的开销。我们需要一种解法，只读一遍文件就能打印最后/^。 

我们可以使用一个数组，存放从文件读取到的所有 A 行和最后的0。因此，这个数组起初 
包含的是 0 -A 行，然后是 1- AT +1 行，接着是 2~尺+2 行，依此类推。每次读取新的一行，就将数 
组中最早读人的那一行淸掉。 

不过，你可能会问，这么做是+是还要移动数组元索，进而引人很大的开销？不会，只要做 
法得当就不会。我们将使用循环式数组，而不必每次都移动数组元素。 

使用循环式数组 （ cireulararray ), 每次读取新的一行，都会替换数组中最早读人的元素。我 
们会以专门的变貴记录这个 元索； 每次加人新元索，该变 ft 就要随之更新。 

下面是循环式数组的例子： 

少 朦 1 ( 初始态 ）： array ■ {a, b, c, d, e, f}. p ■ 0 

步 IR 2 ( 姑入 g) : array * {g, b, c, d, e, f>. p « 1 

少朦 3 ( 插入 : array ■ {g, h, c, d, e, f>. p ■ 2 

步朦 4 ( 插入 : array * {g, h, i, d, e, f>. p ■ 3 

下面是该算法的实现代码。 
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这种解法要求读取整个文件，不过，任意时刻都只会在内存里存放10行内容。 

13.2 比较并对比散列表和 STLmap 0 觀* jUM 实现晰如果输入的数据置不大，可 
以选用哪些数据结构替代散列表？（第89页） 

解法 

在散列表里，值的存放是通过将键传人散列函数实现的。值并不是以排序后的顺序存放。此 
外，散列表以键找出索引，进而找到存放值的地方，因此，插人或査找操作均摊后可以在 0(1) 
时间内完成（假定该散列表很少发生碰撺冲突）。散列表还必须处理潜在的碰撞冲突，一般通过 
拉链法 （ chaining ) 解决，也即创建一个链表来存放值，这些值的键都映射到 N —个索引。 

STL map 的做法是根据键，将键值对插人二叉査找树。不需要处理冲突，因为树是平衡的， 
插人和査找操作的时间肯定为 C )( U>g W )。 


散列表是如何实现的 V 

传统上，散列表都是用元素为链表的数组实现的。想要插人键值对时，先用散列函数将键映 
射为数组索引，随后，将值插人那个索引位置对应的链表。 

注意，在数组的特定索引位置的链表中，各个元索的键并不相同，这些值的 
hashFunction ( key ) 才是相同的。因此.为了取回某个键对应的值，每个结点都必须存放键和值。 

总而言之，散列表会以链表数组的形式实现，链表中每个结点都会存放两块 数据： 值和原先 
的键。此外，我们还要注意以下设计准则。 

(1) 我们希望使用一个优良的散列函数，确保能将键均匀分散开来。若分散不均匀，就会发 
生大最碰撞冲突，査找元索的速度也会变慢。 

(2) 不论散列函数选的多好，还是会出现碰撞冲突， W 此需要一种碰揎处理方法 u 通常，我 
们会采用拉链法，也就是通过链表来处理，但这并不是唯一的做法。 

(3) 我们可能还希望设法根据容最动态扩大或缩小散列表的大小。例如，当元素数量和敗列 
表大小之比超过一定阈值时，可能会希望扩大散列表的大小。这意味着要新建一个散列表，并将 
旧的散列表条目转移到新的散列表中。因为这种操作的开销非常大，所以我们要谨愤些，切不可 
频繁操作。 

如果输入的数据量不大，可以选用哪些数据结构替代散列表？ 

你可以使用 STL map 或二叉树。尽管两者的插人操作需要 0( log (/ i )) 的时间，但若是输人数据 
量够小，这点时间就可以忽略不计。 


13.3 C ++® 函数的工作原理是什么？（第89页） 


解法 

虚函数 (virtual function ) 需要虚函数表 （ vtable . Virtual Table ) 才能实现。如果一个类有函 
数声明成虚拟的，就会生成一个 viable , 存放这个类的虚函数地址。此外，编译器还会在类里加 
人隐藏的 vptr 变量。若子类没有覆写虚函数，该子类的 viable 就会存放父类的函数地址。调用这 
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个虚函数时，就会通过 viable 解析函数的地址。在 C ++ 里，动态绑定 （ dynamicbinding ) 就是通过 
viable 机制实现的。 

由此，将子类对象賦值给基类指针时， vptr 变量就会指向子类的 viable 。 这样一来，就能确 
保继承关系最末端的子类虚函数会被调用到， 

请考虑以下代码。 


1 class Shape { 

2 public : 

3 int edge_length; 

4 virtual int circumference () { 

5 cout << "Circumference of Base Class\n tf ; 

6 return 0 ; 

7 > 

8 >； 

9 class Triangle: public Shape { 

10 public: 


11 int circumference () { 

12 cout« "Circumference of Triangle Class\n"; 



15 }; 

16 void main() { 

17 Shape * x ■ new Shape(); 

18 x->circunference(); // w Circu«ference of Base Class** 

19 Shape *y ■ new Triangle(); 

20 y->circumference(); // “Circumference of Triangle Class M 

21 > 


在上面的代码中， circumference 是 Shape 类的虚闲数. W 此在所有继承 Shape 类的子类 
(Triangle 等）里都为虚函数。在 C++ 里，非虚函数的调用是在编译期通过静态绑定确定的，而 
虚函数的调用则是在运行期通过动态绑定确定的。 


13.4 深拷贝和浅拷贝之间有何区别？请说明两者的用法。（第89页） 


解法 

浅拷贝会将对象所有成员的值拷贝到另一个对 象里。 除了拷贝所有成员的值，深拷贝还会进 
一步拷贝所有指针对象。 

下面是浅拷贝和深拷贝的例子。 



char * ptr; 


3 >； 

4 

5 void shallow_copy(Test & src. Test & dest) { 

6 dest.ptr = src.ptr; 


9 void deep_copy(Test S src. Test & dest) { 

10 dest.ptr = (char *)aalloc(strlen(src.ptr) + 1 ); 



11 strcpy(dest.ptr, src.ptr); 

.12 > 

注意， shallow _ copy 可能会导致大量编程运行时错误，尤其是在对象创建和销毁时。使用 
浅拷 W 时，必须非常小心，只有当开发人员真正知道0己在做些什么时方可选用浅拷贝。多数情 
况下，使用浅拷贝是为了传递一块复杂结构的信息，但又不想真的复制一份数据。使用浅拷贝时， 
销毁对象必须非常小心。 

在实际开发中，浅拷贝很少使用。大部分情况都应该使用深拷贝.特别是当需要拷贝的结构 
很小时。 

13.5 C 语言的关键字 - volatile " 有何作用？（第89页） 

解法 

关键字 volatile 的作用是指示编译器，即使代码不对变贵做任何改动，该变量的值仍可能 
会被外界修改。操作系统、硬件或其他线程都有可能修改该变量。该变 M 的值冇可能遭受意料之 
外的修改，因此，毎一次使用时，编译器都会重新从内存中获取这个值。 

volatile (易变）的整数可由下面的语句 声明： 


要声明指向 volatile 整数的指针，可以这 么做： 

volatile int * x; 
int volatile * x; 

指向非 volatile 数据的 volatile 指针很少见，似也 是卩了行的： 
int * volatile x; 

如若卢明指向一块 volatile 内存的 volatile 指针变 fi ( 指针本身与地址所指的内存都是 
volatile ), 做法 如下： 

int volatile * volatile x; 

volatile 变量不会被优化掉，这非常有用。设想有下面这个 函数： 

1 int opt - 1 ; 

2 void Fn(void) { 

3 start: 

4 if (opt ■■ 1) goto start; 

5 else break; 

6 } 

乍一看，上面的代码好像会进人无限循环，编译器可能会将这段代码优 化成： 


Int opt 篇 1 ; 
if (true) 
goto start; 


9 
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这样就变成了无限循环。然后，外部操作可能会将0写人变量 opt 的位置，从而终止循环。 
为了防止编译器执行这类优化，我们需要设法通知编译器，系统其他部分可能会修改这个变 
量。具体做法就是使用 volatile 关键字，如下所示。 

1 volatile int opt ■ 1 ; 

2 void Fn ( void ) { 

3 start : 

4 if (opt 1) goto start; 

5 else break; 

6 > 

volatile 变量在多线程程序里也很有用，对于全局变量，任意线程都可能修改这些共享的变 
量。我们可能不希望编译器对这些变量进行优化。 

13.6 基 类的析构函数为何要声明为 virtual ? (第 89 页） 

解法 

让我们先想想为何会有虚函数，假设有如下 代码： 

1 class Foo { 

2 public : 

3 void f(); 

4 >； 

5 

6 class Bar : public Foo { 

7 public: 

8 void f(); 


11 Foo * p * new Bar(); 

12 p -> f (); 

调用 p -> fO 最后将会调用 Foo :: f (〉. 这是因为 p 是指向 Foo 的指针，而 f (〉 不是虚拟的。 
为确保 p -> f () 会调用继承关系最末端的子类的 f () 实现，我们需要将 f ( )卢明为虚函数。 
现在，回到前面的析构函数。析构函数用于释放内存和资源。 Foo 的析构函数若不是虚拟的， 
那么，即使 p 实际上是 Bar 类型的，还是会调用 Foo 的析构函数。 

这就是为何要将析构函数声明为虚拟的原因一确保正确调用继承关系最末端的子类的析 
构函数。 


13.7 编写方法，传入参数为指向 Node 结构的指针，返回传入数据结构的完整拷贝。其 
中， Node 数据结构含有两个指向其他 Node 的指针。（第89页） 

解法 

下面的算法将记录一份映射关系，从原先结构中的结点地址对应到新结构中相应的结点。利 
用该映射关系，在这个结构的深度优先遍历中，就能判断某个结点是不是复制过了。遍历时通常 
会标记访问过的结点，标记可以有多种形式，不一定要存放在结点里。 

综上，可以得到一个简单的递归 算法： 
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1 typedef map<Node* i Node*〉 NodeMap; 

2 

3 Node * copy_recursive(Node * cur, NodeMap & nodeMap) { 

4 if(cur == NULL) { 

5 return NULL; 

6 } 

7 

8 NodeMap :: iterator i ■ nodeMap.find(cur); 

9 if (i != nodeMap.end()) { 

10 // 已访问过这里，返田拷 《 

11 return i->second; 

12 } 

13 

14 Node * node ■ new Node; 

15 nodeMap[cur] - node; // 在遍历接之葑.建立峡射关系 

16 node->ptrl - copy_recursive(cur->ptrl, nodeMap); 

17 node->ptr2 * copy_recursive(cur->ptr2, nodeHap); 

18 return node; 

19 } 

20 

21 Node * copy_structure(Node * root) { 

22 NodeMap nodeMap; // 需要一个空的 《ap 

23 return copy_recursive(root, nodeMap); 

24 } 

13.8 编写一个智能指针类。智能指针是一种数据类型，_般用模板实现，模似指针行为 
的同时还提供自动垃圾回收机制。它会自动记录 Smar ' tPoin 1: er < T *> 对象的引用计数，一 ST 类 
型对象的引用计数为零，就会释放该对象。（第89页） 

解法 

智能指针跟普通指针一样，但它借由自动化内存管理保证了安全性，避免了诸如悬挂指针、 
内存泄漏和分配失败等问题。智能指针必须为给定对象的所有引用维护羊一引用计数。 

第一次看到这类问题，可能会觉得太难而不知所措，特別是当你并非 C ++ 专家时。此题有个 
解决之道，分两 步走： （1) 以伪码勾勒出 做法； （2> 实现具体代码。 

按照这种做法，我们需要一个引用计数变量，每新增一个对象的引用，该变 fit 会加 一， 移除 
—个引用则减-%实现代码与下面的伪码 类似： 

1 template <class T> class SnartPointer { 

2 /* 暫能指针类需要指向对象本身及？ I 用计数两者 

3 * 的 指针。 这圣邡必煩是指针，而不是具实的对象 

4 * 或幻用计数值，因为暫能指针的 B 的軋在于， 

5 * 可以跨多个指向某一对象的智能指针，来追琮 

6 * 两一个 幻用计数 */ 

7 T * obj； 

8 unsigned • ref_count; 

9 > 


这个类还需要若干构造闲数和一个析构函数，下面先加上这些函数。 

1 SmartPointer(T * object) { 
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2 /* 想要设定 T * obj 的值，并将引用计数 

3 * 设为 1 */ 

4 } 

5 

6 SmartPointer(SnartPointer<T>& sptr) { 

7 /* 这个构 itA 鈦会新建一个指句已有对象的 

8 * 智能指针.我们需要先设定 obj 和 ref_count, 

9 * 设为指向 sptr 的 obj 和 ref_count. 然后， 

10 * 因为我们新建了一个 obj 的用，所以需要 

11 * 增加 ref_count */ 

12 } 

13 

14 -SmartPointer(SmartPointer<T> sptr) { 

15 I* 銪致该对象的幻用，滅少 ref_count 的值， 

16 * 若 ref_count 为 0, 則鋒放为存放整数而中请的内存， 

17 • 并镝級对象 */ 

18 } 

还有一种方式也可以创建 引用： 将一个 SmartPointer 陚值给另一个。处理这种情况需要搜 
写4作符，不过这里先略述-二。 

19 onSetEquals(SmartPointer<T > ptrl, SmartPointer<T> ptr2) { 

20 /• 若 ptrl 已有值，戒小其幻用 计数. 然后， 

21 * 复 制指向 obj 和 ref_count 的 指针. 最后. 

22 * 因为釗建了新幻用，所以需要增加 

23 * ref_count 的值 *〆 

24 } 

即使尚未填人复杂的 Of 语法，仅仅把做法大致描绘出来，意义已经很重大了。接下来，要 
完成所有代码，只需填补好细节即可。 

template <class T> class SwartPointer { 
public: 

SmartPointer(T * ptr) { 
ref - ptr; 

ref.count - (unsigned*)malloc(sizeof(unsigned)); 

*ref_count - 1; 

} 

8 

9 SmartPointer(SnartPointer<T> & sptr) { 

10 ref - sptr.ref; 

11 ref_count * sptr.ref 一 count; 

12 +4(*ref_count); 

13 } 

14 

15 /* 度写=运算符，这样才能将一个 IO 的 

16 ♦ 暫能指賦值给另一栺针，旧的幻用 

17 * 计数减一，新的智能指针的幻用计数 

18 * 則加一 */ 

19 SmartPointer<T> & operators(SnartPointer<T> & sptr)( 

20 if (this ― &sptr) return *this; 

21 

22 /* 若已赋值为采个对象，«移除幻用 V 

23 if (♦ref_count > 0) { 




remove(); 


ref * sptr.ref; 
pef_count * sptr.ref_ct 
♦+(*ref_count); 
return *this; 


~SmartPointer() { 

removeO; // 移瞭一个对象幻用 


getValue() 


protected : 
void re«ove() { 
--(*ref_count); 
if (*ref_count 0) 
delete ref; 
free(ref_count); 
ref - NULL; 
ref_count * NULL; 


unsigned * ref_count; 


54 >； 

此题的代码复杂难懂.错漏在所难免，面试官也+会强求代码写得完美无缺。 


13.9 编写支持对齐分配的 malloc 和 free 函数，分配内存时， malloc 函数返回的地址必须 
能被2的 n 次方整除。（第89页〉 

解法 

一般来说，使用 malloc , 我们控制不了分配的内存会在堆里哪个位置。我们只会得到一个指 
向内存块的指针，指针的起始地址不定。 

要克服这些限制条件，我们必须申请足够大的内存，要大到可以返回可被指定数值整除的内 
存地址。 

假设需要一个100字节的内存块，我们希望它的起始地址为16的倍数。需要额外分配多少内 
存才够用呢？我们需要额外分配15字节。有了这15字节，加上紧随其后的100字节，就能得到可 
被16整除的内存地址，以及100^节的可用空间。 

具体做法大致 如下： 
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3 void* p = (void*) malloc(required_bytes + offset); 

4 void* q = (void*) (((size_t)(p) + offset) & ~(alignment - 1)); 

5 return q; 

6 > 

第 0 有点难懂，解释如下。假设 alignment 为 16 。很显然，在前 16 字节的某个位置，肯定 
有个内存地址可被 16 整除。执行 (pi + 16> & 11.. 10000, 可将 q 往后移到可被 16 整除的内存地 
址。并地址末 4 位和 0000 执行位与操作，以确保新的值可被 16 整除。 

这种解法近乎无可挑剔，只是有个大 问题： 如何释放这块内存？ 

在上面的代码中，我们额外分配了 15 字节，在释放 “ 真正的 ” 内存时，必须释放这块额外 
内存。 

为了释放整个内存块 . 我们可以将它的起始地址存放在这块 “ 额外 " 内存中。我们会在紧邻 
地址对齐的内存块之前，存放这个地址。当然，这意味着我们现在需要更多的额外内存，以确保 
有足够的空间存放这个起始地址。 

特别是，对于按 alignment 字节数对齐，我们需要额外分配 alignment - 1 + sizeof(void*) 

字节。 

下面是该做法的实现 代码。 

1 void* a 1 igned_ma1loc(size_t required_bytes, size_t alignment) { 

2 void* pi; // 原先的内 4 块 

3 void" p2; // 对齐后的内存坆 

4 int offset - alignment - 1 + sizeof(void*); 

5 if ((pi ■ (void*)i#alloc(required_bytes + offset)) ■■ NULL) { 

6 return NULL; 

7 > 

8 p 2 ■ (void # *)(((size_t)(pl) + offset) & -(alignaent - 1 )); 

9 p2[-l 】 -pi; 

10 return p2; 

11 > 

12 

13 void aligned_free(void *p2) { 

14 /• 为了一 i 性，这里也仿照 aligned_«allocA 数取名 •/ 

15 void* pi = ((void**)p2)[-l]; 

16 free(pl); 

17 > 

下面看看 aligned_free 是怎么运作的，该函数有个传人参数为 p2 ( 与 a ligned_m a ll 0C 里的 
P2 是相同的 ) 。很显然， pi 的值（指向完整内存块的开头）就存放在 p2 的前面。 

如果我们把 P2 看作 void** ( 或者 void * 的数组），就可以按索引 -1 取得 pi 。 然后，释放 pi 
就可释放整块内存。 

13.10 用 C 编 写一个 my2DAlloc 函数，可分 E 二维数组。将 malloc 函数的调用次数降到 
最少，并确保可通过 arr[i][j] 访问该内存。（第 89 页） 

解法 

大家可能都知道，二维数组本质上就是数组的数组。既然可以用指针访问数组，就可以用双 
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重指针来创建二维数组。 

基本思路是先创建一个一维指针 数组。 然后，为每个数组索引，再新建一个一维数组。这样 
就能得到一个二维数组，可通过数组索引访问。 

下面是该做法的实现代码。 

1 int** my2DAlloc(int rows, int cols) { 

2 int** rowptr; 

3 int i; 

4 rowptr ■ (int**) aallocCrows * sizeof(int*)); 

5 for (i ■ 0; i < rows; i-*^) { 

6 rowptr[i] ■ (int*) nalloc(cols • sizeof(int)); 

7 > 

8 return rowptr; 

9 } 

仔细观察上面的代码，注意我们是怎样让 rowptr 根据索引指向具体位置的。下图显示了内存 
是怎么分配的。 



释放这些内存不能直接对 rowptr 调用 free 。 我们要确保不仅释放掉第•次 malloc 调用分配 
的内存，还要释放后续每次 malloc 澜用分 K 的内存。 


1 void ny2D0ealloc(int** rowptr ， int rows) { 

2 for (i ■ e; i < rows; !+♦) { 

3 free(rowptr[i]); 



我们还可以分配一大块连续的内存，这样就不必分配很多个内存块（每一行一块，外加一 
块内存，存放每一行的首地址)。举个例子，对于五行六列的二维数组，这种做法的效果如下 
图所示。 



看到这样的二维数组似乎有点奇怪，注意，它与前一张图并没什么不同。唯一区别是现在是 
一大块连续的内存， w 此，此例中前五个元素指向同一块内存的其他位置。 

下面是这种做法的具体实现。 

1 int** my2DAlloc(int rows, int cols) { 
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int i; 



int data = rows * cols • sizeof(int); 
int** rowptr = (int**)malloc(header + data); 
if (rowptr ― NULL) { 



int* buf = (int*) (rowptr + rows); 
for (i > 0 ; 1 < rows; i-M-) { 
rowptr[i] ■ buf + i * cols; 

} 

return rowptr; 


注意，仔细观察第 11 ~ 13 行代码的具体实现。假设该二维数组有五行，每行六列，则 arrayp ] 
会指向 array [5], array [ l ] 指向 array [ ll ] ,依此类推。 

随后，当我们真正调用 array [ l ][3] 时，计算机会査找 array [1] ,这是个指针，指向内存的 
另一个地方，其实就是指向 arraytS ] 的指针。这个元素会被视为一个数组，然后取出它的第3个 
元素 （ 索引从0开始)。 

用这种方法构建数组只需谰用一次 malloc , 另外还有个好处，就是清除数组时也只需调一次 
free , 而不必专门写个函数释放其余的内存块。 


9.14 Java 


14.1 从继承的角度 来看. 将构造函数声明为私有会有何作用？（第93页） 

解法 

将构造函数声明为私有 （ private ), 可确保类以外的地方都不能直接实例化这个类。在这种 
情况下.要创建这个类的实例，唯一的办法是提供一个公共静态方法.就像 T . 厂方法模式 （Factory 
Method Pattern ) 那样。 

此外，由于构造函数是私有的，因此这个类也不能被继承。 


14.2 在 Java 中，若在 try - catch-finally 的 try 语句块中插入 return 语句 ， finally 
语句块是否还会执行？（第93页） 

解法 

是的，它会执行。当退出 try ® 句块时， finally ® 句块将会执行。即使我们试图从 try ® 句 
块里跳出（通过 return 语句、 continue 语句、 break 语句或任意异常）， finally 语句块仍将得以 
执行。 

注意，有些情况下 finally ® 句块将不会执行， 比如： 

□ 如果虚拟机在 try / catch 语句块执行期间 退出； 

□ 如果执行 try / catch 语句块的线程被杀死终止了。 
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14.3 final、finally 和 finalize 之间有何差异？（第 93 页） 

解法 

尽管名宇相像、发音类似， final 、 finally 和 finalize 的功能截然不同。非常笼统地说， 
final 用于控制变量、方法或类是否“可更改”。 finally 关键字用在 try / catch 语句块中，以确 
保一段代码一定会被执行。一旦垃圾收集器确定没有任何引用指向某个对象，就会在销毁该对象 
之前调用 f inalize () 方法。 

下面是关于这几个关键字和方法的更多 细节。 

1 • final 

上下文不同， final 语句含义有别。 

□ 应用于基本类型 （ primitive ) 变 fi 时： 该变量的值尤法史改。 

口应用于引用 （ reference ) 变 ft 时： 该引用变世不能指向堆上的任何其他对象。 

□ 应用于方 法时： 该方法不允许重写。 

□应用于 类时： 该类不能派生子类。 


2. finally 

在 try 块或 catch 块之后，可以选择加一个 finallyiS 句块。 finally 语句块里的语句一定会 
被执行 （ 除非 Java 虚拟机在执行 try 语句块期间退出)。我们会在 finally 语句块里编写资源回收 
和清理的代码。 

3. finalize () 

当垃圾收集器确定再无任何引用指向某个对象实例时，就会在销毁该对象之前调用 
finalize () 方法，一般用于清理资源，比如关闭文件。 


14.4 C ++ 模板和 Java 泛逛之 间有柯 不同？（第93页） 


解法 

许多程序员都认为模板 （ template ) 和泛型 （generic ) 这两个概念是等价的，因为两者都允 
许你按照 List < String > 的样式编写代码。不过，各种语言是怎么实现该功能的，以及为什么这 
么做，却千差万别。 

Java 泛型的实现植根于“类型消除”这一概念。当源代码被转换成 Java 虚拟机宇节码时，这 
种技术会消除参数化类型。 

例如，假设有以下 Java 代码： 

1 Vector<String> vector = new Vector<String>(); 

2 vector.add(new String( w hello M )); 

3 String str = vector.get(0); 

编译时，上面的代码会被改 写为： 

1 Vector vector = new Vector(); 

2 vector.add(new String( M hello M )); 
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3 String str = (String) vector.get(0); 

有了 Java 泛型，我们可以做的事情也并没有真正改变 多少； 它只是让代码变得漂亮些。鉴于 
此， Java 泛型有时也被称为“语法糖”。 

这点跟 C ++ 的模板截然不同。在 C ++ 中，模板本质上就是一套宏指令集，只是换了个名头， 
编译器会针对每种类型创建一份模板代码的副本。有项证据可以证明这 一点： MyClass < Foo > 不 
会与 MyClass < Bar >* 享静态变童。然而，两个 MyClass < Foo > 实例则会共享静态变童。 

看了下面的代码，应该会更清楚一点： 


1 /*** MyClass.h ***/ 

2 template<class T> class MyClass { 
B public: 



5 MyClass(int v) { val = v; } 

6 >； 

7 

8 /*** MyClass.cpp •••/ 

9 template<typename T> 

10 int MyClass<T>: : bar; 

11 

12 template class MyClass<Foo>; 

13 template class HyClass<Bar>; 


15 /*** main.cpp ***/ 

16 MyClass<Foo> * fool * new MyClass<Foo>(10) 



18 MyClass<Bar> * barl = new MyClass<Bar>(20) 



21 int fl = fool->val; // 等于 15 

22 int f2 = foo2->val; // 等于 15 

23 int bl ■ barl->val; // 等于 35 

24 int b2 = bar2->val; // 等于 35 


在 Java 中， MyClass 类的静态 变貴会 由所有 MyClass 实例共享，不论类坳参数相同与否。 

由于架构设计上的差异， Java 泛型和 C ++ 模板还有如下很多不同点。 

□ C ++ 模板可以使用 int 等基本数据类型。 Java 则不行，必须转而使用 Integer 。 

□在 Java 中，可以将模板的类型参数限定为某种特定类型。例如，你可能会使用泛型实现 
CardDeck , 并规定类姻参数必须扩展自 CardGame 。 

□在 C ++ 中，类型参数可以实例化，但 Java ^ 支持。 

□ 在 Ja ， 中，类型参数 （ 即 MyCla SS < Foo > 中的 Foo ) 不能用于静态方法和变量，因为它们会 
被 MyClass < Foo >* MyClass < BarV ； f 共享。在 C ++ 中，这些类都是不同的，因此类型参数 
可以用于静态方法和静态变量。 

□在 Java 中，不管类型参数是什么， MyClass 的所有实例都是同一类型。类型参数会在运行 
时被抹去。在 C ++ 中，参数类型不同，实例类型也不同。 

记住， Java 泛型和 C ++ 模板，虽然在很多方面看起来都一样，但实则大不相同。 






14.5 Java 中的对象反射是什么？它有什么用？（第93页） 
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解法 

对象反射 （ Object Reflection ) 是 Java 的一项特性，提供了获取 Java 类和对象的反射信息的方 
法，可执行如下操作。 

(1) 运行时取得类的方法和宇段的相关 信息。 

(2) 创建某个类的新实例。 

(3) 通过取得字段引用直接获取和设置对象字段，不管访问修饰符为何。 

下面这段代码为对象反射的示例 3 

1 /• 参数 V 

2 Object[] doubleArgs = new Object[] { 4.2, 3.9 >; 

3 

4 /* 取得矣 V 

5 Class rectangleOefinition = Class.forName( w MyProj.Rectangle**); 

6 

7 /* 等同于： Rectangle rectangle - new Rectangle(4.2，3.9); •/ 

8 Class[] doubleArgsClass » new Class[] {double.class, double.class}; 

9 Constructor doubleArgsConstructor - 

10 rectangleDefinition.getConstructor(doubleArgsClass); 

11 Rectangle rectangle - 

12 (Rectangle) doubleArgsConstructor.newlnstance(doubleArgs); 

13 

14 /* 等 W 于： Double area ■ rectangle.area(); •/ 

15 Method m = rectangleOefinition.getDeclaredMethod( w area w )； 

16 Double area ■ (Double) m.invoke(rectangle); 

这段代码等 同于： 

1 Rectangle rectangle - new Rectangle(4.2, B.9); 

2 Double area * rectangle.area(); 

对象反射有什么用？ 

当然，从上面的例子来看，对象反射似乎没什么用，不过在特定情况下反射可能非常有用。 
对象反射之所以有用，主要体现在以下3个方面。 

(1) 有助于观察或操纵应用程序的运行时行为。 

(2) 有助于调试或测试程序，因为我们可以直接访问方法、构造函数和成员字段。 

(3) 即使事前不知道某个方法，我们也可以通过名字调用该方法。例如.让用户传入类名、 
构造函数的参数和方法名。然后，我们就可以使用该信息来创建对象，并调用方法。如果没有反 
射的话，即使可以做到，也需要一系列复杂的 ifS 句。 

14.6 实现 CircularArray 类，支持类似数组的数据结构，这些数据结构可以高效地进 
行旋转。该类应该使用泛型.并通过标准的 for (Obj o : circularArray ) 语法支持迭代操 
作。（第93页） 


解法 

此题实际上有两部分。首先，我们需要实现 CircularArray 类。其次，需要支持迭代。下面 
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将分别加以说明。 

实现 CircularArray 类 

实现 CircularArray 类的方式之一是每次调用 rotate(int shiftRight ) 时都要移动元素。 
当然.这么做效率低下。 

反之，我们可以只创建一个成员变量 head , 指向概念上应被视作循环数组开头的元素。我们 
不必四处移动数组元素，只需通过 shiftRight 增加 head 的值。 

下面是该做法的实现代码。 

1 public class CircularArray<T> { 

2 private T[] items; 

B private int head * 0 ; 

4 

5 public CircularArray(int size) { 

6 items = (T[]) new Object[size]; 

7 > 

8 

9 private int convert(int index) { 

10 if (index < 0) { 

11 index Iteiis.length; 

12 > 

13 return (head + index) X iteas.length; 

14 > 

15 

16 public void rotate(int shiftRight) { 

17 head ■ convert(shiftRight); 

18 } 

19 

20 public T get(int i) { 

21 if (i < 0 11 i >= itens.length) { 

22 throw new java.lang.IndexOutOfBoundsException( w ...*•); 

23 > 

24 return items[convert(i)]; 

25 > 

26 

27 public void set(int i, T itea) { 

28 items[convert(i)] ■ itea; 

29 > 

30 ) 

其中有几个地方很容易出错， 比如： 

□ 我们无法创建泛型的数组。相反，我们必须将数组转型或者将 items 类型定义为 List < T >。 
为了简单起见，这里选用了前一种做法。 

□ 执行 negvalue 51 ； posVal ( 负值 ％ 正值）时， X 操作符会返回负值。举个例子， -8 X 3 
的结果为 -2。 这跟数学家定义的取模函数不同，我们必须将负数索引加上 items . length , 
以得到正确的正数值。 

□无论何时都必须确保将原索引转成旋转后的索引。为此，我们实现了 convert 函数供其他 
函数使用。即使 rotate 函数也会使用 convert 。 这是一个很好的代码复用的范例。 






现在，我们明确了 CircularAfray 的基本代码，接下来可以专注于迭代器的实现。 


实现迭代器 (Iterator) 接口 

此题的第二部分要求我们实现 CircularArray 类之后，可以这么写 代码： 

1 CircularArray<String> array = ... 

2 for (String s : array) { ... } 

要做到这一点，就必须实现 Iterator 接口。 

为实现 Iterator 接口，我们需要做到以下两点。 

口修改 CircularArray<T> 定义，添加 implements Iterable<T>, 同时还要在 Circular 
Array<T> 里加人 iterator() 方法。 

□ 创建实现 Iterator<T> 的 CircularArrayIterator<T> , 同时，还要在 CircularArray 
Iterator 里实现方法 hasNext() 、 next() 和 remove() D 
完成上述工作后， for 循环就会如魔法般地发挥作用。 

为节省篇幅，以下代码中与之前 CircularArray 实现相同的部分已删除。 

1 public class CircularArray<T> iaplements Iterable<T> { 

2 ■争. 


3 




public Iterator<T> iterator() { 


/* _current 反峡从旋袴后的开头算起的移值， 
* 而不是从原始数妞的开头算起 •/ 


^Override 

public boolean hasNext() { 


^Override 
public TI next() { 


return item; 


^Override 

public void reaove() { 

throw new UnsupportedOperationException( w ...**); 


} 
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注意，在上面的代码中，当 for 循环第一次迭代时，会调用 hasNext (), 然后是 next (〉。 务 
必确保你的实现会返回正确的值。 

在面试中碰到类似题 B 时，很有可能想不起来需要调用哪些方法和接口。在这种情况下，你 
还是应该竭尽所能地解题。如果你能推导出可能需要用到哪些方法，光这样就能向面试官展现出 
你具备的能力。 

9.15 数据库 

问题1 ~ 3用到以下数据库 模式： 


Apartiwnts , 


Buildings 


Tenants 


UnitNumber 

varchar 

CoaiplexIO 

int 

TenantName 

varchar 

BuildingID 

int 

BuildingName 

varchar 





Address 

varchar 




Complexes 


AptTenants 


Requests 


ConplexID 

int 

TenantID 

int 

RequestID 

int 

ComplexName 

varchar 

Apt ID 

int 

Status 

varchar 





Apt ID 

int 





Description 

varchar 


注意，每套公寓可能冇多位承租人，而每位承租人可能租住多套公寓。每套公 寓隶厲 于一栋 
大楼，而每栋大楼属于一个综合体。 

15.1 编写 SQL 査询.列出租住不止一套公寓的承 租人。 （第97页） 

解法 

要解决此题，我们可以使用 HAVING 和 GROUP BY 子句，然后将 Tenants 以 INNER ]0 IN 连接 
起来。 



4 (SELECT TenantID 

5 FROM AptTenants 

6 GROUP BY TenantID 

7 HAVING count(.) > 1) C 

8 ON Tenants.TenantID = C.TenantID 

在面试或现实生活中，每当编写 GROUP BY 子句时，务必确保 SELECT 子句里的任何东西，要 
么是聚集函数，要么就是包含在 GROUP BY 子句里。 
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15.2 编写 SQL 查询，列出所有建筑物，并取得状态为 “Open” 的申请数量 （Requests 
表中 Status 为 Open 的条目）。（第97页） 

解法 

此题直接将 Requests 和 Apartments 连接起来，就能列出建筑物 ID, 并取得 Open 申请的数童 r > 
取得这份列表后，再将它与 Buildings 表进行连接。 


1 SELECT BuildingNane, ISNULL(Count, 0) as *Count* 

2 FROM Buildings 



4 (SELECT Apartments.BuildinglD, count( # ) as r Count J 

5 FROM Requests INNER JOIN Apartments 

6 ON Requests.AptID - Apartments.AptID 

7 WHERE Requests.Status > 'Open' 

8 GROUP BY Apartments.BuildingID) ReqCounts 

9 ON ReqCounts.BuildingID « Buildings.BuildingID 


诸如这种有子査询的査询，务必要经过全面测试，手写时尤当如此。最好先测试杳询的内层, 
然后再测试外层部分。 


15.3 11号建筑物正在进行大翻修 。 》写 SQL 查询.关闭这栋建筑物里所有公禽的入住申 
请。（第97页） 

解法 

跟 SELECT 査询一样， UPDATE 査询也可以有 WHERE 子句。要实现这个査询，我们会获取 11 号建 
筑物里所有公寓的 ID ,然后从这些公寓取得人住申请列表。 

1 UPDATE Requests 

2 SET Status = Closed* 

3 WHERE AptID IN 

4 (SELECT AptID 

5 FROM Apartments 

6 WHERE BuildingID » 11) 

15.4 连接有哪些不同类型？谪说明这些类型之间的差异，以及为何在某些情形下，某 
种连接会比较好。（第97页） 

解法 

DOIN 用于合并两个表的结果。要执行 ]OIN» 作，每个表里至少要有一个宇段，可用来配对另 
一个表里的记录。连接的类型规定了哪些记录会进人合并结果集。 

下面以两张表 为例： 一张表列出常规饮料，另一张表是无卡路里饮料。每张表有两个 字段： 
饮料名称 （ name) 和产品编号 （ code >。编号 （ code) 字段用来配对记录。 

常规 饮料： 
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BUDWEISER 


COCACOLA 

| Pepsi 

PEPSI 


无卡路里 饮料: 



Code 


COCACOLA 

Fresca 

FRESCA 

Diet Pepsi 

PEPSI 

Pepsi Light 

PEPSI 

Purified Water 

Water 


欲将 Beverage ^ Calorie-Free Beverages 连接起来，我们可以有多种选择，说明如下。 

□ INNER JOIN : 结果集只含有配对成功的数据。在这个例子里，我们会得到三条记 录：一 

条包含 COCACOLAifl 号，两条包含 PEPSI 编号。 

□ OUTER : JOIN : OUTER : JOIN — 定会包含 INNER : JOIN 的结果，不过它也可能包含一些在其他 

表里没有配对的 i 己录。 OUTER 30 IN 还可分为以下几种子类型。 

■ LEFT OUTER DOIN 或简称 LEFT DOIN ： 结果会包含左表的所有记录。如果右表中找不到 
配对成功的记录，则相应字段的值为 HULL 。 在这个例子里，我们会得到四条记录。除 
了 INNER ] OIN 的结果，还会列出 BUDWEISER . 因为它位于左表中。 

■ RIGHT OUTER 30 IN 或简称 RIGHT DOIN ： 这种连接刚好与 LEFT : JOIN 相反。它会返回包 
括右表的所有 i 己录；左表缺失的字段为 NULL 。 注意，如果有两张表 A 和 B , 那么，可以 
认为语句 A LEFT DOIN B 与 B RIGHT 30 IN A 等价。在上面的例子里，我们会得到五条 
记录。除 Tinner :] oin 结果，还会有 fresca 和 water 两条记录。 

■ FULL OUTER 30 IN ： 这种连接会合并 LEFT 和 RIGHT :] OIN 的结果。不论另一个表里有无 
配对记录，这两个表的所有记录都会放进结果集中。如果找不到配对记录，则对应的 
结果字段的值为 NULL 。 在这个例子里，我们会得到六条记录。 

15.5 什么是反规范化？ 请 说明优缺点。（第97页） 

解法 

反规范化 （ denormalization >是一种数据库优化技术，在一个或多个表中加人冗余数据。在 
使用关系型数据库中，反规范化可帮助我们避免开销很大的表连接操作。 

相比之下，在传统的规范化数据库中，我们会将数据存放在不同的逻辑表里，试图将冗余数 
据减到最少，力争做到在数据库中每块数据只有一份副本。 

例如，在规范化数据库中，我们可能会有 Courses 表和 Teachers 表。在 Courses 里，每个条 
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目都会储存课程 （ Course ) 的 teacherlD, 但不存储 teacherName = 如欲获取所有课程 （Courses ) 
对应的教师 （Teacher) 姓名，只需对这两个表进行连接。 

就某些方面来看，这么做很不错。如有教师更改名宇，我们只需更新一个地方的名宇。 
不过，这么做的缺点在于，如果表很大，就需要花费过长时间对这些表执行连接操作。 

而反规范化则可以达成一定的平衡。在反规范化时，我们确定自己可以接受一定的冗余，并 
在更新数据库时要多做些工作，从而减少连接操作，保证较髙的 效亨。 


反规范化的缺点 

反规范化的优点 

电新和 插人操作开销吏大 

连接操作较少.因此 

松索数据更快 

反规范化会使 e 新和插人 

代码 c 难写 

黹轚査找的表较少.因此检索奄 

询比较简觫（因而也不容 a 出错> 

败据可能不一致•哪 块数据 

才愚-正确"的呢？ 


数据存在冗余， 

黹要甕大的存 銪空间 



在注重可扩展性的系统中，比如大 S 科技公司，几乎一定会兼用规范化和反规范化数据库的 
各种要素。 

15.6 有个数据库，里面有公司 （ companiesk 人 ( people ) 和专业人员 ( professionals . 
为公51工作）.请绘制实体关系图。（第97页） 

解法 

在公司 （ Companies ) 上班的人 （ People ) 称作专业人员 （ Professional >。 因此， People 
和 Professional 之间是 ISA (“is a ”） 关系（或者说 Professional 派生自 People )。 

除了从 People 派生的属性， Professional 还有一些附加信息，包括学历 （degree ) 和工作经 
验 （experience ) 等。 

每位 Professional 同一时间只能为一家 Company 工作，而 Companies 则可以同时雇佣多位 
Professional, 因此 Professional 和 Companies 之间是多对一的关系 。 “Works For ” 关系可以 
存放员工的人职时间和薪资等属性。这些属性只有在将 Professional 与 Company 相关联时才会 
定义。 

一个 People 可能拥有多个电话号码，所以 Phone 是个多值属性。 
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15.7 给定一个储存有学生成38的简单数据库。设计这个数据库的大概样子.并 W 写 SQL 
查询. 返回优等生名单（排名前 10% ), 以平均分排序。（第 97 页） 


解法 

在一个简单的数据库中，最起码会有三个 对象 ： Students (学生 ）、 Courses (课程）和 
CourseEnrollment (选修课程）。 Students 至少会有学生姓名、学号 （ ID ), 还可能包含其他个 
人信息。 Courses 会包含课程名和代号，或许还有课程说明、教授和其他信息 。 CourseEnrollment 
会将 Students 和 Courses 配对起来，还会含有 Grade % 段。 


| Students 

StudentID 

int 

StudentNaae 

varchar(iee) 

Address 

varchar(500) 


Courses 

CourselO 

int 

CourseNaae 

varchar(iee) 

ProfessorID 

int 


1 CourseEnrollaefit 

CourselD 

int 

StudentID 

int 

Grade 

float 

Tem 

int 


①原文为 CourscGradc 。 -译者注 
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要是加上教授的资料、学分费用信息和其他数据，这个数据库就会变得相当复杂。 

使用微软 SQL Server 里的 TOP … PERCENT 函数，我们可以先尝试如下（错误的）査询： 

1 /* 錯谈代 鵠 V 

2 SELECT TOP 10 PERCENT AV6(CourseEnrollaent.Grade) AS GPA, 

3 CourseEnrolliient. StudentID 

4 FROM CourseEnrollment 

5 GROUP BY CourseEnrollaent.StudentID 

6 ORDER BY AVG(CourseEnrollaent.Grade) 

以上代码的问题在于，它只会如实返回按 GPA 排序后的前10%行记录。设想这样一个 场景： 
有100名学生，排名前15的学生的 GPA 都是4.0。上面的函数只会返回其中10名学生，与我们的要 
求不符。在得分相同的情况下，我们希望计人得分前10%的学生，即使优等生名单的人数超过班 
级总人数的10%. 

为纠正这个问题，我们可以建立类似的査询，不过首先要取得筛选优等生的 GPA 基准。 


1 DECLARE ^GPACutOff float ； 



FROM CourseEnrollment 

GROUP BY CourseEnrollaent.StudentID 


7 ORDER BY GPA desc) 

8 Grades); 

接着，定义好 ^ GPAOJtOff 后，要筛选最低拥有该 GPA 的学生，就相当容易了。 



7 HAVING AVG(CourseEnrollMent.Grade) >- gGPACutOff) Honors 

8 INNER D0IN Students ON Honors.StudentID ■ Student.StudentID 


对于你所做出的隐含假设条件，必须非常小心。仔细査看上面的数据库描述，你会发现哪些 
可能是不正确的假设？其中之一是每门课程只能由一位教授来教。而在某些学校，一门课程可能 
会由多位教授来教。 

不过，你还是需要做出一些假设，要不然会把自己搞疯。相比你做了哪些假设，更重要的是 
认识到自己做出了假设。不论是在实际搡作还是面试中，就算假设条件不正确，只要可以识别出 
来，就能予以妥善处理。 

此外，请记住.弹性和复杂度之间需要权衡取舍。若建立的系统支持一门课程可由多位教授 
来教，的确会增加数据库的弹性，但又徒增其复杂度。倘若要让数据库灵活应对各种可能的情况， 
最终数据库只会变得复杂 不堪。 

尽量让你的设计保持合理的弹性，并陈明任何其他的假设或限制条件。这不仅适用于数据库 
设计，对于面向对象设计和常规的编程同样适用。 
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9.16 线程与锁 


16.1 线程和进程有何区别？（第103页） 


解法 

进程和线程彼此有关联.但两者有着根本上的不同。 

进程可以看作是程序执行时的实例，是一个分配了系统资源 （ 比如 CPU 时间和内存）的独立 
实体。每个进程都在各自独立的地址空间里执行，一个进程无法访问另一个进程的变量和数据结 
构。如果一个进程想要访问其他进程的资源，就必须使用进程间通信机制，包括管道、文件、套 
接字 （ socket ) 及其他形式。 

线程存在于进程中.，共享进程的资源（包括它的堆空间）。同一进程里的多个线程将共享同 
—个堆空间。这跟进程大不相同，一个进程不能直接访问另一个进程的内存。不过，每个线程仍 
然会有自己的寄存器和找，而其他线程可以读写堆内存。 

线程是进程的某条执行路径。当某个线程修改进程资源时，其他兄弟线程就会立即看到由此 
产生的变化。 

16.2 如何测 置上下 文切换时间？（第103页〉 

解法 

此题比较棘手，我们不妨先从一种可能的解法 人手。 

上下文切换 （ contextswitch ) 是两个进程之间切换（也即，将等待中的进程转为执行状态， 
而将正在执行的进程转为等待或终止状态）所耗费的时间。这样的动作会发生在多任务处理系统 
中，操作系统必须将等待中进程的状态信息栽人内存，并保存执行中进程的状态信息。 

为了解决此题.我们需要记录两个交换进程执行最后一条和第一条指令的时间戮，而上下文 
切换时间就是这两个进程的时间戳差值。 

举个简单的 例子： 假设只有两个进程 P ,* P 2 。 

P , 正在执行， P 2 则在等待执行。在某一时间点，操作系统必须交换 P , 和 P 2 , 假设正好发生在 
P , 执行第 Af 条指令之际。若 / u 表示进程 x 执行第 it 条指令的时间戳，单位为微秒，则上下文切换需 
要 _ 微秒。 

此题棘手的地方 在于： 如何知道两个进程何时会进行交换呢？当然，我们无法记录进程每条 
指令的时间載。 

还有一个问题，进程交换是由操作系统的调度算法负责的.另外还可能有很多内核态线程也 
会进行上下文切换。其他进程也可能会竞争 CPU , 或者内核还要处理中断，用户控制不了这些不 
相干的上下文切换。举例来说，若内 核在/ 时刻决定处理某个中断，那么，上下文切换时间就会 
比预估的更长。 

为克服这些障碍，我们必须先构造一个 环境： 在 P , 执行之后，任务调度器会立即选中并执行 
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P 2 。 具体做法是在 P ,* P 2 之间构造一条数据通道，如管道，让这两个进程玩一场数据令牌的桌球 
游戏。 

换言之，我们让 P , 作为初始发送方， P 2 作为接收方。一开始， P 2 阻塞（睡眠）等待获取数据 
令牌。行时会将令牌通过数据通道递送给 P 2 , 并立即尝试读取响应令牌。然而，由于 P 2 还没 
有机会执行，因此？,收不到这个响应令牌.继而被阻塞并释放 cpu 。 

随之而来的就是上下文切换，任务调度器必须选择另一个进程执行。 p 2 正好处于随时可执行 
的状态，因此也就顺理成章地成为任务调度器可选择执行的理想候选者。当 p 2 执行时， 

角色互换了。现在， p 2 成为发送方，而为被阻塞的接收方。当 p 淑令牌返回给 p 咐， 游戏即 
告结束。 

简而言之，这个游戏一个来回由以下步骤组成， 

( 1 ) p 2 阻塞，等待 p , 发送的数据。 

(2) Pi 标记开始时间。 

(3) 匕向？ 2 发送令牌。 

(4) P , 试着读 ® P 2 发送的响应令牌.引发上下文切换。 

(5) P 2 被调度执行，接收 P , 发送的令牌。 

⑹ P 2 向送响应令牌。 

(7) P 2 试着读取？,发送的响应令牌，引发上下文切换。 

(8) P , 被调度执行，接收 P 2 发送的令牌。 

(9) 巧标记结束时间。 

这里的关键在于数据令牌的发送会引发上下文切换。令 T ^ TV 分别为发送和接收数据令牌的 
时间.并令 T c 为上下文切换耗费的时间。在第⑵步， P ^ id 录令牌发送的时间戳，而在第 (9) 步则 
记录了令牌响应的时间戳。这两个事件之间用掉的时间 T 表示 如下： 

T = 2*( T rf + T f + T r ) 

这个算式由以下事件 组成： Pi 发送一个令牌 (3), CPU 上下文切换 (4), P 2 接收这个令牌(5)。 
随后， P 2 发送响应令牌(6>, CPU 上下文切换 (7), 最后到这个应令牌⑻。 

接着，由 P , 很容易就能计算 T , 即事件3和事件8之间经过的 时间。 总之，若想求出 T c , 我们 
必须先确定 乃+1 的值。 

该怎么做呢？我们可以测送和接收令牌所耗费的时间多少。不过这不会引发上下文切 
换，因为发送这个令牌时 P , 正在 CPU 中执行，而且接收时也不会处于阻塞状态。 

将上述游戏重复玩多个来回，以剔除步骤 (2) 和 (9) 之间可能因意料之外的内核中断和其他内 
核线程对 CPU 的竞争而引人的时间变动。我们将选择测得的最短上下文切换时间作为最终 
答案。 

话说回来，最后我们只能说，这只是近似值，而且取决于底层系统。比如，我们做了这样的 
假设： 一旦数据令牌可用， P 2 就会被选中并执行。而实际上，这要取决于任务调度器的具体实现, 
我们无法做出任何保证。 

没关系，就算这样也不 要紧。 在面试中，能够意识到你的解法或许不够完美，这一点很重要。 
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16.3 在著名的哲学家就餐间题中. 一 群哲学家围坐在圆燊周围，毎两位哲学家之间有一 
根 筷子。 每位哲学家需要两根筷子才能用餐，并且一定会先寧起左手边的筷子.然后才会去搴 
右手边的筷子。如果所有哲学家在同一时间拿起左手边的筷子.就有可能造成死锁。请使用线 
程和锁，编写代码模拟哲学家就餐问题，避免出现死锁。（第103页） 

解法 

首先，先不管死锁，让我们写些代码简单模拟哲学 家就餐 问题。具体实现时，从 Thread 派生 
Philosopher , Chopstick 被拿 起来时会调用 lock.lockQ ,放下时则调用 lock . unlock ()。 

1 public class Chopstick { 

2 private Lock lock; 

3 

4 public Chopstick() { 

5 lock = new ReentrantLock(); 

6 > 

7 

8 public void pickUp() { 

9 void lock.lockO; 

1 ® > 

11 

12 public void putDown() { 

13 lock.unlock(); 

14 > 

15 > 

16 

17 public class Philosopher extends Thread { 

18 private int bites - 10; 

19 private Chopstick left; 

20 private Chopstick right; 

21 

22 public Philosopher(Chopstick left, Chopstick right) { 

23 this.left - left; 

24 this.right ■ right; 

25 > 

26 

27 public void eat() { 

28 pickUp(); 

29 chew(); 

30 putDown(); 

31 > 

32 

33 public void pickUp() { 

34 left.pickUp(); 

35 right.pickUp(); 

36 } 

37 

38 public void chew() { } 

39 

40 public void putDown() { 

41 left.putDown(); 

42 right.putDown(); 
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43 > 

44 

45 public void run() { 

46 for (int i ■ 0; i < bites; i-M-) { 

47 eat(); 

48 > 

49 > 

50} 

如果所有哲学家都拿起左手边的一根筷子，并都等着拿右手边的另一根筷子 .， 运行上面的代 
码就可能造成死锁。 

为了防止发生死锁，我们的实现可以采用如下 策略： 如有哲学家拿不到右手边的筷子，就让 
他放下已拿到的左手边的 筷子。 

1 public class Chopstick { 

2 /• 同前 V 

3 

4 public boolean pickUp() { 

5 return lock.tryLock(); 

6 > 

7 } 

8 

9 public class Philosopher extends Thread { 
ie /• W 前 •/ 

11 

12 public void eat() { 

13 if (pickUpO) { 

14 chew(); 

15 putDown(); 

16 > 

17 > 

18 

19 public boolean pickUpO { 

20 /• 试着拿起《子 •/ 

21 if (lleft.pickUpO) { 

22 return false; 

23 > 

24 if (Iright.pickUpO) { 

25 left.putD 0 Mn(); 

26 return false; 

27 > 

28 return true; 

29 > 

30 > 


在上面的代码里，要确保拿不到右手边的筷子时就要放下左手边的 筷子； 如果手上根本没有 
核子，就不该调用 putDown (〉。 

16.4 设计 一 i' 类，只有在不可能发生死锁的懦况下，才会提供锁。（第 103 页） 

解法 

防止死锁有几种常见的方法，其中常用的做法之一是，要求进程事先声明它需要哪些锁。然 
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后，就可以加以验证，若提供锁是否会造成死锁，会的话就不提供。 

谨记这些限制条件 • 下面来探讨如何检测死锁。假设多个锁被请求的顺序 如下： 

A = {1, 2, 3, 4> 

B = {1, 3, 5} 

C - <7, 5, 9, 2} 

这可能会造成死锁，因为，存在以下 场景： 

八 « 住 2, 哥待 3 

B« 住 3, 矛待 5 

C 鏑住 S, 等待2 

我们可以将上面的场录看作一个图，其中2连接到3、3连接到5,而5连接到2。死锁会由环表 
示。 如果某个进程声明它会在锁住 w 后立即请求锁 v , 则 图里就会存在一条边 ( w , V )。 以先前的 
例子来说，在图里会存在下面这些边： （1, 2)、 （2, 3)、 （3, 4)、 （1, 3)、 （3, 5>、 （7, 5〉、 
<5, 9)、 （9, 2)。至于这些边的“所有者”是谁并不重要。 

这个类需要一个 declare 方法，线程和进程会以该方法声明它们请求资源的顺序。这个 
declare 方法将迭代访问声明顒序.将邻近的每对元索 ( v , w ) 加到 图里。 然后，它会检査是否存 
在环。如果存在环，它就会原路返回，从图中移除这些边，然后退出。 

现在只剩下一部分有待 探讨： 如何检测冇无环？我们可以通过对每个连接起来的部分（也就 
是图中每个连接在一起的部分）执 行深度 优先搜索来检测有没有环。也有算法能选择图中所有连 
接的部分，但那样就会更复杂了。就此题而言.还没必要复杂到这个程度。 

我们时以确定，如果出现/环，就表明是某一条新加人的边造成的。这样一来，只要深度优 
先搜索会探测所冇这些边,.就等同于做过完整的搜索。 

这种特殊的环的检测算法，其伪码如下 所示： 


boolean checkForCycle(locks[] locks) { 

touchedNodes = hash table(lock •> boolean) 
initialize touchedNodes to false for each lock 
for each (lock x in process.locks) { 
if (touchedNodes[x] »■ false) { 
if (hasCycle(x, touchedNodes)) { 
return true; 


14 boolean hasCycle(node x, touchedNodes) 

15 touchedNodes[r] = true; 

16 if (x.state == VISITING) { 


e if (x.state == FRESH) 
(see full code below) 
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注意，在上面的代码中，可能需要执行几次深度优先搜索，但 touchedNodes 只会初始化一 
次。我们会不断迭代，直至 touchedNodes 中所有值都变为 false 。 

下面的代码提供了更多细节。为了简单起见，我们假设所有锁和进程（所有者）都是按顺序 
排列的。 

1 public class LockFactory { 

2 private static LockFactory instance; 

3 

4 private int numberOfLocks * 5; /* 缺省 */ 

5 private LockNode[] locks; 

6 

7 r 从一个进《或所有者块射列该 

8 * 所有者室称它会 要求鏑 的順序 */ 

9 private Hashtable<Integer > LinkedList<LockNode>> lockOrder; 

10 

11 private LockFactory(int count) { ... } 

12 public static LockFactory getlnstance() { return instance; } 

13 

14 public static synchronized LockFactory initialize(int count) { 

15 if (instance ■■ null) instance * new LockFactory(count); 

16 return instance; 

17 } 

18 

19 public boolean hasCycle( 

20 Hashtable<Integer, Boolean 》 touchedNodes, 

21 int[] resourcesInOrder) { 

22 /* 梭查 有无坏 */ 

23 for (int resource : resourcesInOrder) { 

24 if (touchedNodes.get(resource) false) { 

25 LockNode n ■ locks[resource]; 

26 if (n.hasCycle(touchedNodes)) { 

27 return true; 

28 > 

29 } 

30 } 

31 return false; 

32 > 

33 

34 /* 为了避兔 死镝， 强制每 个进《 部要事先玄告 

35 • 它们要 求铺的 順年.检证这个順序不会形成 

36 * 死銷（在有向围篁出现 

37 * 环 > V 

38 public boolean declare(int ownerld, int[] resourcesInOrder) { 

39 Hashtable<Integer J Boolean> touchedNodes = 

40 new Hashtable<Integer, Boolean>(); 

41 

42 /* 将结点加入图中 V 

43 int index ■ 1; 

44 touchedNodes.put(resourcesInOrder[0], false); 

45 for (index = 1; index < resourcesInOrder.length; index++) { 

46 LockNode prev = locks[resourcesInOrder[index - 1]]; 

47 LockNode curr = locks[resourcesInOrder[index]]; 
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48 prev.joinTo(curr); 

49 touchedNodes.put(resourcesInOrder[index ], false); 

50 > 

51 

52 /* 如果出现了环，铕 ft 这份資源列表，并 

53 * 返囬 false V 

54 if (hasCycle(touchedNodes, resourcesInOrder)) { 

55 for (int j ■ 1; j < resourcesInOrder.length; j++) { 

56 LockNode p s locks[resourcesln0rder[j - 1]]; 

57 LockNode c * locks[resourcesInOrder!j]]; 

58 p.renove(c); 

59 > 

60 return false; 

61 > 

62 

63 /* 为检測到坏， 保存玄 告的順 4 , 以便 

64 * 验证该进 e 确实按*它玄称的順序要求 

65 * « V 

66 LinkedList<LockNode> list ■ new LinkedList<LockNode>(); 

67 for (int i ■ 0; i < resourcesInOrder.length; i-M-) { 

68 LockNode resource * locks[resourcesInOrder[l]]; 

69 list.add(resource); 

70 > 

71 lockOrder.put(ownerId, list); 

72 

73 return true; 

74 } 

75 

76 /• 取 得掮， 首先铨证该进 《确 实按照它玄告的礪斤 

77 * 要求鏑 V 

78 public Lock getLock(int ownerld, int resourcelD) { 

79 LinkedList<LockNode> list ■ lockOrder.get(ownerld); 

80 if (list *■ null) return null; 

81 

82 LockNode head ■ list.getFirst(); 

83 if (head.getId() »» resourcelO) { 

84 Ust.removeFirstO; 

85 return head.getLock(); 

86 > 

87 return null; 

88 } 

89 } 

90 

91 public class LockNode { 

92 public enum VisitState { FRESH, VISITING, VISITED 

93 

94 private ArrayList<LockNode> children; 

95 private int lockld; 

96 private Lock lock; 

97 private int maxLocks; 

98 

99 public LockNode(int id, int nax) { ... } 

100 

101 /* 连接 ~this« 结点与 “node~ 结点，检查以螭保这么做不会 






9.16 线程与锁 303 


102 * 形成环 V 

103 public void joinTo(LockNode node) { children.add(node); } 

104 public void remove(LockNode node) { children.remove(node); } 

105 

106 /* 以深度优先搜索检查是否存在坏 

107 public boolean hasCycle( 

108 Hashtable<Integer J Boolean 〉 touchedNodes) { 

109 VisitStatef] visited = new VisitState[»axLocks]; 

110 for (int i « 0; i < aaxLocks; { 

111 visited 【 i 】 ■ VisitState.FRESH; 

112 > 

113 return hasCycle(visited, touchedNodes); 

114 > 

115 

116 private boolean hasCycle(VisitState[] visited, 

117 Hashtable<Integer J Boolean 〉 touchedNodes) { 

118 if (touchedNodes.containsKey(lockld)) { 

119 touchedNodes.put(lockld, true); 

120 > 

121 

122 if (visited[lockId] -- VisitState.VISITING) { 

123 /• 还在访 问时却 W 到了这个紿点， 

124 • 表明有环 •/ 

125 return true; 

126 > else if (visited[lockId] -- VisitState.FRESH) { 

127 visited[lockld] - VisitState.VISITING; 

128 for (LockNode n : children) { 

129 if (n.hasCycle(visited, touchedNodes)) { 

130 return true; 

131 } 

132 } 

133 visited[lockld] - VisitState.VISITED; 

134 > 

135 return false; 

136 > 

137 

138 public Lock getLock() { 

139 if (lock ■■ null) lock ■ new ReentrantLock(); 

140 return lock; 

141 > 

142 

143 public int getld() { return lockld; } 

144 } 


如同以往，当你看到这段既复杂又冗长的代码时，就会明白面试官一般不会要求你写出全部 
代码。更有可能的情况是，面试官会要求你勾勒出伪码，并实现其中一个方法。 


16.5 给定以下 代码： 

public class Foo { 
public Foo() { ... } 
public void first() { ... } 
public void second() { ... } 
public void third() {... > 
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同一个 Foo 实例会被传入3个不同的线程。 threadA 会调用 first , threadB 会调用 second , 
threadC 会调用 third 。 设计一种机制，确保 first 会在 second 之前调用， second 会在 third 
之前调用。（第103页） 


一般的逻辑是检査在执行 second () 之前 first () 是否已完成，在调用 third (> 之前 second () 
是否已完成。我们必须小心处理线程安全，因此，简单的布尔标志达不到要求。 

那么，以如下代码来使用锁，怎么样？ 

1 public class FooBad { 

2 public int pauseTime - 1900; 

3 public ReentrantLock lockl, lock2, lock3; 

4 

5 public FooBad() { 

6 try { 



// 标记 firstO 巳完成 


/ 等待，直完成 


// 标记 second (> 己完成 


等待，直 ilsecondQ 完成 





这段代码实际上并不满足题目要求，关键在于销 的所有 权这个概念。真正请求锁的是一个线 
程（在 FooBad 构造函数中），而释放锁的却是另一个线程。这么做是不允许的，这段代码会抛出 
异常。在 Java 中，锁的所有者和拿到锁的线程必须是同一个。 

换种做法，我们可以用信号量重现这一行为，整个逻辑完全相同。 

1 public class Foo { 

2 public Semaphore senl, se«2, sen3; 

3 

4 public Foo() { 

5 try { 

6 semi » new Semaphore(l); 

7 sem2 ■ new Seroaphore(l); 

8 semB * new Semaphore(l); 

9 

10 seml.acquire(); 

11 sem2.acquire(); 

12 semB.acquire(); 

13 > catch (...) {... > 


public void first() 
try { 


seml.release(); 
catch (•••>{••• 


public void second() 
try { 

seml.acquire(); 

seml.release(); 

sem 2 .release(); 

} catch (...) {... 


public void third() { 
try { 

sem2.acquire(); 

sem2.release(); 


16.6 给定一个类，内含同步方法 A 和普通方法 B 。 在同一个程序实例中，有两个线程，能 
否同时执行 A ? 两者能否同时执行 A 和 B ? (第104页） 


解法 

在方法前加上关键字 synchronized ,即可保证两个线程无法同时执行某个对象的同步方法。 
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因此，第一个子问题的答案要视具体情况而定。如果两个线程拥有该对象的同一实例，那么， 
答案就是否定的，它们不能同时执行方法 A 。 不过，要是这两个线程拥有该对象的不同实例，就 
能同时执行方法 A 。 

在概念上，你可以从"锁”的角度来考虑答案。同步方法会对所属对象特定实例的所有同步 
方法上锁，从而阻止任何其他线程执行那个实例的同步方法。 

第二个子问題问的是， thread 2 在执行非同步方法 B 时， thrcadl 能否执行同步方法 A 。 既然 B 
不是同步方法，在 thread 2 执行方法 B 时，也就无从阻止 thrcadl 执行方法。不管 thrcadl 和 thread 2 是 
否拥有该对象的同一实例.这一点都成立。 

说到底，此题强调的关键槪念是，那个对象的每个实例只能执行一个同步方法。其他线程可 
以执行该实例的非同步方法，或者，它们可以执行该对象不同实例的任意方法。 

9.17 中等难题 

17.1 编写一个函数.不用临时变置，直接交换两个数。（第104页） 

解法 

这是个经典面试题，也相当直接。我们将用 a # 示 a 的初始值， b , 表示 b 的初始值，用 diff 表 
示 a •- b * 的值。 

让我们将3 > b 的情形绘制在数轴上。 


I Idiff I 

0 b . a , 

首先，将 a 设为 diff , 即上囱数轴的右边那一段。然后， b 加上 diff (并将结果保存在 b 中）, 
就可得到 a e 。 至此，我们得到1) ■ 3,和3 ■ diff 。 最只霱将 b 设为 a , - diff , 也就是 b - a 。 
下面是具体的实现代码。 

1 public static void swap(int a, int b) { 

2 // 以 a = 9、 b = 4 为例 

3 aBa-b;//a*9-4 = 5 

4 b«a+b; //b«5+4=9 

5 a=b-a;//a«9-5 

6 

7 System.out.println(**a : n + a); 

8 System.out.println( n b: ** ♦ b); 

9 } 

我们还可以用位操作实现类似的解法，这种解法的优点在于它适用的数据类型更多，不仅限 
于整数。 

1 public static void swap_opt(int a, int b) { 

2 " 以 a * 101 ( 二进制）扣 b = 110 为例 

3 a = a A b; // a = 101 A 110 = 011 




b = a A b; // b * 011 A 110 = 101 
a ■ a A b; // a - 011 A 101 ■ 110 
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7 System.out.ppintln( w a : u + a); 

8 Sy ste«. out. print In ( : ** + b); 

9 } 

这段代码使用了异或操作，要了解个中细节,最简单的方法就是看看两个比特位 p 和 q 的情况， 
-探究竞。这里会用 P , 和示初始值。 

如能正确交换两个比特位，整个操作就能正确无误地进行。下面将逐行解析交换 过程。 

1 P ■ P. A q. /* 若 P« ■ q_W 为 0, 若 l» q.«*l •/ 

2 q - p A q . /• 等于 p •的值 •/ 

3 p - p A q /• 等于 q •的值•/ 

第1行执行操作 p ■ P ，％ 若 p , ■ q , 则结果为0;若 p,l = q e 则为1。 

第2行执行 q = p A q e , 可以就 p 为0和1两种可能的值进行检査。最终目的是要交换 p 和 q 的初始 
值，我们希望这个操作返回 p , 的值。 

口若 p ■ 0:则 p , = q e , 因此，我们需要该操作返 [ DlpeiKq *。 任意值与0异或都会返冋初始 
值，由此可知该操作会正确返回 q ,( 或 p , )。 

□若 p = 1:则 p,l = q e 。 我们希望该操作，当 q , 为0时返回1, p , 为1时返回0。这正是将任 
意值与1执行异或操作的结果。 

第3行执行 p = p « q , 再次检査 p 为0和1两种值的情况.目的是返 Mq ,。 注意， q 现在等于 p ,, 
因此其实是在执行 p A p e 。 

□若 p ■ 0:由于 p , » q „ 我们希望该操作返回 p » lEq ,, 不论哪一个都可以。执行 0 Ap e 会返 
回 P *, 等于 q *。 

口若 p = l : 该操作其实是在执行1>。这会翮转 p » 的值， （《 这正是我们想要的，因为 Pel = q,o 

至此，我们已将 p 设为 q ,， q 设为 p ,。 综上，上述搡作会正确交换两个比特位，因此，就能正 
确交换整个整数。 

17.2 设计一个算法.判断玩家是否贏了井字游戏。（第104页） 

解法 

乍一看，可能会觉得此题真的很简单，不就是直接检査井字棋盘，这会有多难呢？细一想，此 
题还是有点复杂的，而且没有唯一的“完美”答案。根据你的喜好不同，会有不一样的最佳解法。 

解决此题，有几个重要的设计决策需要考虑。 

(1) haswon 只会调用一次还是很多次 （ 比如，放在网站上的井字游戏）？如果答案是后者， 
我们可能会增加一些预处理，以优化 haswon 的运行时间。 

(2) 井宇游戏通常是34棋盘。我们只是针对34大小的棋盘进行设计，还是要实现一个 ATxjy 
的解法？ 

(3) 对于程序大小、执行速度和代码淸晰度，一般如何区分它们的优先级呢？记住，最高效 
的代码不一定是最好的。代码是否容易理解、维护也很重要。 
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解法1:如果 hasWon 会被调用很多次 

总共只有3 9 ,大约20000种井字游戏棋盘（假设为 3 x 3 的棋盘)。因此，用一个 int 就能表示， 
其中每个数位代表棋盘中的一格 （0 为空、1为红、2为 蓝〉。 我们会事先设定好一个散列表或数组， 
将所有可能的棋盘作为键，值则代表谁 贏了。 这么一来， hasWon 函数就很简 单了： 

1 public int hasWon(int board) { 

2 return winnerHashtable[board]; 

3 > 

要将一个棋盘（以字符数组表示）转成一个 Int , 可以运用 “3 进位"表示法，每个棋盘 
可表示为 3 b v 0 + 3 i v i + 3 2 v j + ...+3 S ； 8 . 若格子为空则 v , 为 0, 格子为蓝色则 v , 为 1, 格子为红色 
则 v , 为2。 


public static int convertBoardToInt(char[][] board) 
int factor - 1 

« 0 ; 

e 

■ e ; 


•or (int 
for (int : 


»oard.length; iM) { 
board[i].length; 


if (board[i)[j] — f x 9 ) 
v - 1; 

} else if (board[i][j] 
v - 2; 

} 

sum +- v * factor; 
factor •* 3; 


至此，要判断谁是贏家，只需査询散列表即可。 

当然，如果每次判断谁贏了都要将棋盘转成这种格式，那么跟其他解法相比，其实并没有节 
省多少时间。但是，如果一开始躭以这种格式存储棋盘，那么，査询操作将会非常有效率。 


解法2:专为 3 x 3 棋盘设计 

如果只想为34棋盘设计一种解法，代码就会比较简短且简单。复杂的地方只剩下如何写得 
清晰而有条理，并且不要写出太多重复代码。 


1 Piece hasWonl(Piece[][] board) { 

2 for (int i = 0; i < board.length; { 

3 /* 检查行 */ 

4 if (board[i][0] != Piece.Empty && 

5 board[i][0] == board[i][l] && 

6 board[i][0] == board[i][2]) { 

7 return board[i][0]; 


/* 检查列 V 

if (board[0][i] 1= Piece.Empty && 




12 board[0][i] == board[l][i] && 

13 board[0][i] — board[2][iJ) { 

14 return board[0][l]; 

15 > 

16 } 

17 

18 /* 检查对角 ft •/ 

19 if (board[0][0] !■ Piece.Enpty && 

20 board[0][0] == board[l][l] && 

21 board [0][0] ― board[2][2]) { 

22 return board[0][0]; 

23 > 

24 

25 /* 松查逆对角线 V 

26 if (board[2][0] !■ Piece.Empty && 

27 board[2][0] « board[l][l] && 

28 board[2][0] -= board[0][2]) { 

29 return board[2][9]; 

30 > 

31 return Piece.Empty; 

32 } 

解法 3: 面向棋盘进行设计 

有了 3 x 3 棋盘的实现代码，自然就会想到要扩展到棋盘。本书可下载的源码提供了另外 
儿种解法，下面是其中一种。 

1 Piece hasWon3<Piece[][] board) { 

2 int N ■ board.length; 

3 int row ■ 0; 

4 int col - 0; 

5 

6 /• 撿查行 V 

7 for (row - 0; row < N; row4-f) { 

8 if (board[row][0] !■ Piece.Eapty) { 

9 for (col - 1; col < N; coI-m-) { 

10 if (board[row][col] !* board[row][col-1]) break; 

11 > 

12 if (col n) return board[row][0]; 

13 > 

14 > 

15 

16 /* 捨査刊 V 

17 for (col * 0; col < N; col-^-) { 

18 if (board[0][col] 1« Piece.Empty) { 

19 for (row ■ 1; row < N; row++) { 

20 if (board[row][col] !■ board [tom- 1 ] [col]) break; 

21 > 

22 if (row =* N) return board[0][col]; 

23 > 

24 } 

25 

26 /* 检查对角浅（左上刻右下 ）V 

27 if (board[0][0] != Piece.E«pty) { 
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for (row = 1; row < N; row++) { 

if (board[row][row] !■ board[row-1][row-1]) break; 

> 

if (row == N) return board[0][0]; 


/* 检查对角钱 （左下刻 右上 ） V 
if (board[N-l][e] != Piece.Empty) { 
for (row « 1; row < N; row++) { 

if (board[N-row-1][row] != board[N-row][row-1]) break; 

> 

if (row -■ N) return board[N-l][0]; 


e.Empty; 


不论你的解法为何，此越的算法并不是太难。重点在于理解如何写出淸晰、可维护的代码, 
而这也正是面试官想要评估的地方。 


17.3 设计一个算法.算出 n 阶乘有多少个尾随零。（第104页） 

解法 

简单的做法是先算出阶乘，然后不断地除以10,数一数有几个尾随零 （ trailingzero )。 但 
这种做法的问题是，使用 int 很快就会越界。为了避开这个限制，我们可以从数学上来分析这 
个问题。 

下面以阶乘19!为例进行 说明： 


10{存数就会形成尾随零，而10倍数又吋分解为一组组5倍数和2倍数。 

例如，在191中，下列几项会形成尾 随零： 

19! - 2 * ... * 5 * ... • 10 * ... * 15 * 16 * ... 

因此，为了 算出尾 随零的数最，我们只需计算有几对5和2倍数。不过，2倍数始终要比5倍数 
多，最后只要数出5倍数就可以了。 

这里有个陷阱，就是15只能算一个5倍数（因此会形成一^尾随零），而25算两个 （25 = 5 • 5)。 
编写代码时，相关代码有两种写法。 

第一种写法是迭代访问所有2到/»的数字，计算每个数字中有几个5。 

1 /* 苦數字为 S 的倍数 . 返 ®s 的几次方 

2 * 5 -> 1, 

3 * 2S-> 2 等 

4 */ 

5 public int factorsOf5(int i) { 

6 int count = 0 ; 

7 while (i % S == 0) { 


i /= 5; 
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10 > 

11 return count; 

12 } 

13 

14 public int countFactZeros(int nu_) { 

15 int count * 0; 

16 for (int i ■ 2 ; i <■ nun; i4-f)( 

17 count factopsOfS(i); 

18 > 

19 return count; 

20 > 

这么写还不赖，不过，我们还可以做得更有效率 一点： 直接数一数5的因数。采用这种做法， 
我们会先数一数1到之间，有几个5的倍数（数量为^»/5 ), 然后数一数25的倍数有几个 （ H /25), 
接着是125,依此类推。 

要算出 n 中有几个 m 的倍数，直接将 n 除以 m 即可。 

1 public int countFactZeros(int nun) { 

2 int count - 0 ; 

3 if (nuia < 0) { 

4 return -1; 

5 > 

6 for (int i - 5; nun / i > 0; i •- 5) { 

7 count nun / i; 

8 > 

9 return count; 

10 } 

此题有点像脑筋急转弯，不过.还是可以通过逻辑思考来解决（如上所示)。只要思考一下 
到底有哪些条件会 形成尾 随零，就能得到解法。你必须从一开始就透彻地理解相关规则，才能正 
确地实现出来。 

17.4 编 写一个 方法，找出两个数字中最大的 那一个 。不得使用 if^else 或其他比较运算符。 
(第104页） 

解法 

max 函数的常见实现方式是检査 - 6 的正负号。但这里不能使用比较运箅符检査正负情况， 
不过我们可以使用乘法。 

假定表的正负号，如果 fl -6>=0, 则 t 为 1. 否则 A 为0。令9为刷反数。 

那么，我们可以实现如下 代码： 

1 /* 1 变 0. 041 •/ 

2 public static int flip(int bit) { 

3 return l"bit; 

4 } 

5 

6 /* a 为正则返田 1, a 为返回 0 */ 

7 public static int sign(int a) { 

8 return flip((a » 31) & 0x1); 
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public static int getMaxNaive(int ; 
int k * sign(a - b); 
int q « flip(k); 


这段代码看似可行，实则不济。要是 a -6 溢出，这段代码就行不通。例如，假设 a 为 INT_MAX 
- 2, 6为-15。此时， a -峨 大于 INT _ MAX 并且会溢出，最终变为负值。 

运用同样的方法，我们可以实现此题的解法，目标是当维持 A 为1的条件。为此，我们 
需要使用更为复杂的逻辑。 

a - Mf ■么时候会溢出呢？它只会在 a 为正、6为负时溢出，或者，反过来也有可能。专门检测 
溢出条件可能比较困难，不过，我们可以检测 a 和 M 6 I 时会有不同的正负号。注意，如果 a 和6的正 
负号不同，就 itA 筹于 sign ( a )。 

具体逻辑如 F : 


1 1 〒 8 和 1) 的正 «| 号不 《: 

2 // 若 a > 0, Mb < 0ik - 1 

3 // 若 a < 0, Mb > 0 且 k = e 

4 // H 此 . 不管釋种情况 .k ■ sign(a) 

5 let k ■ slgn(a) 

6 else 

7 let k - sign(a - b) // 这 X 不再有溢出 

上述逻辑的实现代码如下，其中使用了乘法而不是句。 


public : 


- b; 

int sa - sign(a); // if a >- 0, then 1 else ( 
int sb - slgn(b); // if b >■ 0, then 1 else I 
int sc - sign(c); // 取决于 a • b 有没有溢出 

/* Q 标： 定义 lc 的值，若 a > bJM 为 1， a < b 利为 0 
* ( 若 a ■ b, k 为何值无关緊要 ） V 

// 若 a 和 b 正炎亏 不同， 則1 ( » sign(a) 
int use_sign_of_a * sa A sb; 

// 若 a 和 b 正灸号 钿同， «k « sign(a - b) 
int use_sign_of_c ■ flip(sa A sb); 

int k = use_sign_of_a * sa + use_sign_of_c • 
int q - flip(k);_//_k 的反数 


注意，为清晰起见，我们将代码拆分成多个方法和变量。很显然，这不是最紧凑或最有效率 
的写法，但这么写代码要清晰许多。 
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17.5 珠 ifl 妙算游戏 （The Game of Master Mind ) 的玩法如下。 

计算机有四个檷，每个懵放一个球，颜色可能是红色 （R )' 黄色 （Y )、绿色 （ G ) 或蓝色 （B )。 
例如.计算机可能有 RGGB 四种（槽1为红色，槽2、3为绿色，權4为蓝色)。 

作为用户，你试图猜出颜色组合。打个比方.你可能会獮 YRGB 。 

要是猜对某个槽的颜色.则 算一次 •'猜 中' 要是只猜对颜色但槽位期错了.则籌一次“伪 
獮中”。注意，“》中”不能算入••伪篇中”。 

举物子.实合为 RGBY . 刪 I 價的是 GGRR , 则算一刻 I 中，一次伪脚。 

给定 一个猜 测和一种颜色组合，编写一方法，返回猜中和伪猜中的次数。（第104页） 


解法 

此题简单明了，但令人惊讶的是，写代码时很容易犯小错误。代码写好后，你应该对照各种 
测试用例，进行全面彻底的检査。 

编写代码时，我们首先会构造一个频率数组，存放每个宇符在 solution 中出现的次数，但 
不包括某个槽被"猜中”的次数。然后，迭代 guess 算出伪猜中的次数。 

下面是这个算法的实现代码。 


public class Result { 
public int hits ■ 0; 
public int pseudoHits 


public String toString() 
return n (" + hits + 


T; 


10 public int code(char c) 

11 switch (c) { 

12 case *3* 


'> public static int MAX_C0L0RS - 4; 


27 public Result estinate(String guess. String solution) { 

28 if (guess.length() != solution.length()) return null; 


Result res = new Result(); 

int[] frequencies = new int[MAX COLORS]; 
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/* 计算猜中次数，构造頻率表 •/ 
for (int i * 0; i < guess.length(); i++) { 
if (guess.charAt(i) »■ solution.charAt(i)) 
res.hits-M-; 

> else { 

/* 只有不是猜中的情况下.才增加頻牟表 
* (将用 于伪猜 中）. 若是锖中，那么， 

• 该槽位已被"使用 M */ 
int code ■ code(solution.charAt(i)); 
frequencies [ code ]o; 


r 计算伪猜中 V 

for (int i ■ 0; i < guess.length(>; i-M-) { 
int code » code(guess.charAt(i)>; 
if (code >- 0 && frequencies[code] > 0 && 
guess.charAt(i) !■ solution.charAt(i)) 
res. pseudoHits-f-f ； 
frequencies[code]--; 


注意，问题所需的算法越简单，写出淸晰、正确的代码就越显重要。在上面的例子中，我 
们提取代码专门写了个 code(charc> 方法，并创建了一个 Result 类来保存结果，而非只是打印 

显示。 

17.6 给定一个整数数组，编写一个函数，找出索引《和《,只要将 m 和/•之间的元素排 
好序.整个数组就是有 序的。 注意. •《-« 越小越好，也就是说，找出符合条件的最短序列。（第 


开始解题之前，让我们先确认一 F 答案会是什么样的。如果要找的是两个索引，这表明数组 
中间有一段有待排序，其中数组开头和末尾部分是排好序的。 

现在，我们借用下面的例子来解决 此题： 


首先映人脑海的想法可能是，直接找出位于开头的最长递增子序列，以及位于末尾的最长递 
增子序列。 


左边：1, 2, 4, 7, 10, 11 
中间： 7, 12 

右边： 6, 7, 16, 18, 19 

很容易就能找出这些子序列，只需从数组最左边和最右边开始，向中间査找递增子序列 。一 
旦发现有元素大小顺序不对，那就是找到了递增/递减子序列的两头。 
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但是，为了解决这个问题，还需要对数组中间部分进行排序，只要将中间部分排好序，数组 
所有元素便是有序的。具体来说，就是以下判断条件必须为真： 

/* 左边 （ left) 所有元小于中 « (Biddle) 的所有元素 V 
min (middle) > end (left) 


/* 中间 (middle) 所有 元索彝 要小于右边 （ right) 的所有元縈 V 
max(middle) < start(right) 


或者，换句话说，对于所有 元素: 


left < Middle < right 

实际上，上例的这个条件绝不可能成立。根据定义，中间部分的元素是无序的。而在上面的 
例子中， left , end > middle .start 且 middle .end > right . start —定成立。这样一来，只排 
序中间部分并不能让整个数组有序。 

不过，我们还可以缩减左边和右边的子序列，直到先前的条件成立为止。 

令 min 等于 min ( middle ) , max 等于 max ( niddle ) 0 

对左边部分，我们先从这个子序列的末尾开始（值为11,索引为 5), 并向左移动，直至找到 
元索索引/使得 array [ i ] < min ； 找到后只需排序中间部分，就能让数组的那部分有序。 

然后，对右边部分进行类似操作，此时 max 等于12。我们先从右边 f 卬列的起始元索（值为 6) 
开始，并向右移动，将中间部分的最大值12依次与6、7、16比较。找到16时，就能确定在16的右 
边已经没有元素比12小了（因为右边是递增子序列)。至此，对数组中间部分进行排序，以使整 
个数组都是有序的。 

下面是这个算法的实现代码。 


int fIndEndOfLeftSubsequence(lnt[] array) { 
for (int i ■ 1 ; i < array.length; i 4 -f) { 
if (array 【 i】< array[i - 1 ]) return i - 1 ; 

> 

return array.length - 1; 


it findStartOfRightSubsequence(int[] array) { 
for (int i ■ array.length - 2 ; i >■ 0 ; i--) { 
if (array[i】> array[i -f 1]) return i ♦ 1; 


15 int shrinkLeft(int[] array, int _in_index, int start) 

16 int comp = array[ain_index]; 

17 for (lnt i * start • 1 ; i >■ 0 ; i--) { 

18 if (array[i 】 <=comp) return i ♦ 1; 


10 ; 


;int shrinkRight(int[] array, int i 


int start) 
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24 int comp = array[nax_index] ; 

25 for (int i • start; i < array.length; i++) { 

26 if (array[i] >■ comp) return i - 1; 

27 > 

28 return array.length - 1; 

29 } 

30 

31 void findUnsortedSequence(int[] array) { 

32 r 找出左子序列 V 

33 int end__left - findEndOfLeftSubsequence(array); 

34 

35 /* 找出右子序列 */ 

36 int start_right ■ findStartOfRightSubsequence(array); 

37 

38 /* 找出中间部分的最小值和最大值 •/ 

39 int nin_index - end_left ♦ 1; 

40 if (min_index >* array.length) return; // 已排序 

41 

42 int max_index ■ start_right - 1; 

43 for (int i ■ end_left; i <■ start_right; i++) { 

44 if (array[i】< array[_in_index]) «in_index = i; 

45 if (array[i] > array[aax_index]) _ax_index ■ i; 

46 } 

47 

48 /• 句左移动， 

49 int left_index ■ shrinkLeft(array« _in_index, end_left); 

50 

51 /* 甸右移动，直列大于 3 尸广 3 乂【 11»¥_10<^ 哭 ] 傘 / 

52 int right-index ■ shrinkRight(array, nax.index, start_right); 

53 

54 Systeal.out.prlntln(left_lndex + " * + right index); 

55} 

注意，在上面的解法中，我们还创建了不少方法。虽然也可以把所有代码一股脑儿塞进一个 
方法，但这样一来，代码理解、维护和测试起来就要难得多。在面试中写代码时.你应该优先考 
虑这几点。 

17.7 给 定一个 整数，打印该整数的英文描述（例如 “One Thousand , Two Hundred - 

Thirty Four " X , (第 104 页） 

解法 

此题并不太难，反倒有点乏味。关键在于解題的过程和组织，并确定你有完普的测试用例。 
举个例子，在转换19 323 984时，我们可以考虑分段处理，每三位转换一次，并在适当的地 
方插人 "thousand" (千〉 和 “miUion” （ 百万)。也即. 

convert(19 323 984) - convert( 19 )+ * million M + 
convert (323> + w thousand * + 
convert(984) 

下面是该算法的实现代码。 




28 
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处理这类问题的关键在于，因为有很多特殊情况，所以要确保考虑到所有特殊情况。 

17.8 给定 一个整 数数组（有正数有负数）.找出总和最大的连续数列.并返回总和。（第 
104页） 

解法 

此题难度不小，但又极为常见。接下来，我们会通过下面的例子来 解题： 


如果把上面的数组看作是正数数列和负数数量交替出现，我们会发现，答案绝不会只包含某 
负数子数列或正数子数列的一部分。何以见得？只包含某负数子数列的一部分,将使得总和过小， 
我们应该排除整个负数数列才对。同样地，只包含正数子数列的一部分也会显得很怪，因为若包 
含整个子数列，总和就能变得更大。 

为广构思出算法，我们可以把数组看作一个正负数交错出现的数列。每个数字代表正数子数 
列的总和，或负数子数列的总和。对于上面的数组，简化后 如下： 


我们无法从中立即窺得很棒的算法，不过，它确实可以帮助我们更好地理解手头正在处理的 
问题。 

考虑上面的数组。把 {5, -9} 视作子数列说得通吗？不，这两个数字的总和为 -4, 所以最好 
两个数字都不要，或者考虑只包含子数列 {5} ,只有一个元素。 

什么情况下需要在子数列中包含负数呢？只有当它能将两个正子数列拼接在一起，并且两者 
加起来大于这个负数的时候。 

我们可以一步一步地找出答案，先从数组的第一个元素开始。 

首先看到 S , 这是到目前为止最大的总和。我们将 maxsum 设为 S , 并将 sum 设为5。接着，考 
虑 -9, 将它与 sum 相加会得到负值„将子数列从 S 延伸到 -9 并没有意义（只会将子数列缩减为 >4), 
因此我们会重置 sum 的值。 

现在看到6,这个子数列比5大，因此更新 maxsuni 和 sun 。 

接着来看 -2, 与6相加， SU m « 为4。由于总和仍会变大（与其他部分连接时，会有更长的数 
列），我们有可能想把 {6, -2} 纳人最长子数列，因此更新 sum , 但不更新 maxsum 。 

最后看到3, 3加上 su » (4) 结果为7,更新 maxsum ， 最后得到最长子数列为 {6, -2, 3}。 

推而广之，对于完全展开的数组而言，处理逻辑是一样的。下面是该算法的实现代码。 

1 public static int. getMaxSun(int[] a) { 

2 int maxsum = 0; 

3 int sum = 0; 

4 for (int i ■ 0; i < a.length; i++) { 

5 sun 4 — a[i]; 

6 if (naxsun < sun) { 
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} else if (sun < 0 ) { 
sum = 0; 



如果整个数组都是负数，怎么样才是正确的行为？看看这个简单的 数组： {-3, -10, -5), 
以下答案每个都说 得通： 

(1) -3 (假设子数列不能为 空）； 

(2) 0 ( 子数列长度为 零)； 

(3) MINIMUM_INT ( 视为错误情况 ) D 

我们会选择第二个 （maxsum = 0). 但其实并没有所谓的“正确”答案。这一点可以跟面试 
官好好讨论一番，这样也能展示出你是个注重细节的人。 

17.9 设计一方法，找出任意指定单 词在一 本书中的出现 频串。 （第104页） 

解法 

曲对面试官，该问的第一个问题是，这个操作是执行一次还是+断被执行。也就是说，你是 
只要找出 “ dog ” 的频率，还是想找出 “ dog ”， 接着是 “ cat ”、“ mouse ”， 等等？ 

1. 解法： 单次査询 

在这种情况下，我们会直接逐字逐句地扫描整本书，数一数某个单词出现的次数，用时0(/0。 
可以确定这是最短用时，因为不管怎么样，我们必须査看过书中的每个申-词。 

2. 解 法： 重复查询 

如果是要重复执行査询操作，那么，或许值得我们多花些时间，多分配内存.对全书进行预 
处理。我们可以构造一个散列表.将单词映射到该单词的出现频率，这么一来，任意单问的频率 
都能在 0(1) 时间内找到。具体实现代码如下。 


1 Hashtable<String, Integer 〉 setupDictionary(String[] book) { 

2 Hashtable<String, Integer 〉 table = 

3 new Hashtable<String, Integer>(); 

4 for (String word : book) { 

5 word = word.toLowerCase(); 

6 if (word.trim() != "**) { 

7 if ((table.containsKey(word)) { 

8 table.put(word, 0); 
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17 if (table *» null | | word == null) return -1; 

18 word = word.toLowercase(); 

19 if (table.containsKey(word)) { 

20 return table.get(word); 

21 > 

22 return 0; 

23 > 

注意.相对而言，这类问题还是比较容易的。因此，面试官会更看重你的心思有多缜密，有 
没有检査错误条件？ 

17.10 XML 非常冗长，你找到一种«码方式，可将每个标签对应为预先定义好的整数值， 
该编码方式的语法 如下： 

Element ••> Tag Attributes END Children END 
Attribute — > Tag Value 

END --> 0 

Tag ••> 对应到某个 《 先定义好的整数值 

Value — > 字符串值 END 

例如.下列 XML 会被转换压缩成下面的字符串（假定对应关系为 family ->1 、 person 
•>2、 firstName •> 3、 lastName -> 4、 state •> 5)。 

<fanily lastNane» w HcDowell M state- w CA'*> 

<person firstNameB ,f Gayle M >Soflie Message</person> 

</family> 

变为： 

14 McDowell 5 CA 0 2 3 Gayle 0 Some Message 0 0. 

编写代码.打印 XML 元素编 6 后的版本（传入 Element 和 Attribute 对象)。 （ 第105页） 

解法 

由题目可知，元素会以 Element 和 Attributed 为参数传人，因此具体代码相当简单，可以 
运用类似树状结构的做法实现。 

我们会不断对 XMLiS 构的各个部分调用 encode (), 根据 XML 元素的类型.处理方式稍有不同。 

1 public static void encode(Element root, StringBuffer sb) { 

2 encode(root.getNameCode (), sb); 

3 for (Attribute a : root.attributes) { 

4 encode(a, sb); 

5 > 

6 encode( w 0 M , sb); 

7 if (root.value !» null && root.value I- { 

8 encode(root.value, sb); 

9 > else i 

10 for (Element e : root.children) { 

11 encode(e, sb); 

12 > 

13 > 

14 encode( w 0*’, sb); 

15 } 
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16 

17 public static void encode(String v, StringBuffer sb) { 

18 sb.append(v); 

19 sb.append(" n ); 

20 } 

21 

22 public static void encode(Attribute attr, StringBuffer sb) { 

23 encode(attr.getTagCode (), sb); 

24 encode(attr.value, sb); 

25 > 

26 

27 public static String encodeToString(Element root) { 

28 StringBuffer sb * new StringBufferO; 

29 encode(root^ sb); 

30 return sb.toString(); 

31 } 

请留意第 17 行代码，有个负责处理字符串的简单方法 encode 。 这个方法似乎有点 W 蛇添足， 
它无非就是插人字符串并附加一个空格。不过，使用这个方法有个好处，可以确保每个元索之间 
都有空格。否则，很可能就会忘记附加空白符从而打乱编码。 

17.11 给定 fand 5(), 实现一 个方法 r * and 7()。 也即.给定一个产生0到4 (含）随机 
数的方法.»写一个产生0到6 ( 含）随机数的方法。（第105页） 

解法 

这个函数要正确实现，则返回0到6之间的值，每个值的槪率必须为1/7。 

1.第一次尝试（调用次数固定） 

第一次尝试时，我们可能会想产生出0到9之间的值，然后再除以7取余数。代码大致 如下： 

1 int rand7() { 

2 int v ■ rand5() ♦ rand5(); 

3 return v % 7; 

4 } 

可惜的是.上面的代码无法以相同的概率产生所有值。分析一下每次调用 ^>1(15() 返回的结 
果与 rand 7(〉 函数返回值的对应关系，就能确认这一点。 

因为每一行会调用两次 rand 50. 每次调用返回不同值的概率为1/5,所以，每一行出现的概 
率为1/25。数一数每个数字出现的次数，就会发现这个 rand 7(〉 函数以5/25的概韦返回4,而返回 
0的概率为3/25。也就是说，这个函数与题目要求不符，返回各种结果的槪率并非1/7。 

现在设想一下，若我们要修改上面的函数加上一条 if ® 句，并修改常数乘数或再插人一个 
randSO 调用，同样会产生一张类似的表格，而每一行组合出现的概率将是1/5*，其中 A 为那一行 
调用 rand 5() 的次数。不同行调用 rand 5() 的次数可能不同。 

最终， rand 7() 函数返冋结果的概率，比如6,为所有结果为6的行的概率总和，也 就是： 
/>{ rand 70 = 6) = 1/5* + 1/夕 + ... + 1/5" 

为了保证函数正确实现，这个概率必须等于1/7。 
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但这又不可能，因为5和7互质，5倒数的指数级数不可能得到1/7。 

难道此题尤解吗9并非如此。严格地说.这意味着. randS () 调用组合的结果若能得到 rand 7(〉 
的某个特定值，只要能列出来，该函数就不会返回均匀分布的结果。 

我们还是有办法解出此题的，只不过必须使用 while 循环，另外请注意，我们无法确定返回 
一个结果要经过几次循环。 

2.第二次尝试（调用次数 不定） f 

只要能使用 while 循环，工作就会变得简单许多。我们只需产生出一个范围的数值，且每个 
数值出现的概率相同（且这个范围至少要有7个元 素)。 如果能做到这一点，就可以舍弃后面大于 
7的倍数的部分，然后将余下元素除以7取余数。由此将得到范围0到6的值，且每个值出现的概率 
相等。 

下面的代码会通过 S * rand 5() + randSQ 产生范围0到24。然后，舍弃21和24之间的数值， 
否则 rar > d 70 返回0到3的值就会偏多，最后除以7取余数，得到范围0到6的数值，每个值出现的概 
率相同。 

注意，这种做法需要舍弃一些值，因此不确定返回一个值要调用几次 rand 5(), 这就是所谓 
的调用次数不定。 

1 public static int rand7() { 

2 while (true) { 

3 int num = 5 * randS() ♦ rand5(); 

4 if (nun < 21) { 

5 return num X 7; 
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注意，执行 S * rand 5() + randSO 正好只提供了一种方式来取得范围0到24之间的每个数 
值，这就确保了每个值出现的概率相同。 

可以换个做法执行2 * randso + rand 5(> 吗？不行，因为这些值不是均匀分布的。例如， 
取得@两种方式（6=2*1+4和6 = 2*2+2), 而取得0 ( 0=2*0+0 >则只有一种方式，在范围里的 
值出现概率不等。 

还有一种做法就是使用2 • randSO , 这样也能得到均匀分布的值，但要复杂 得多。 代码 如下: 


public int rand7() { 
while (true) { 

int rl ■ 2 • rand5(); /• 抽 》9 之间的供數 •/ 
int r2 ■ rand5(); /• 之后会用来产生 0 或 1 •/ 
if (r2 !- 4) { /* r2 有多余的供数，舍务之 •/ 
int randl « r2 % 2; /• 产生 0 或 1 V 
int nun « rl ♦ randl; /• 将会在范到 9 之间 •/ 
if (nun < 7) { 
return nun; 

» > 


亊实上，我们可以使用的范围是无限的。关键在于确保该范围足够大，且范围内所有值出现 
的概率相同。 


17.12 设计 一个 算法，找出数组中两数之和为指定值的所有整数对。（第105页） 


解法 

此题有两种解法，至于哪一种“比较好”，取决于你在时间效率、空 N 效率和代码复杂度之 
间如何取舍。 


1. 简单解法 

这个解法简单且高效 （ 时间上），使用一个整数到整数的散列映射。这个算法会迭代整个数 
组，对于元素在散列表中査找 sum -*, 若存在就打印 ( x , sum - x )。 将 x 加人散列表，然后继续 
处理下一个元素。 


2. 另一种解法 

首先，让我们从定义人手。试着要找一对总和为 2 的数，则 X 的补数为 Z - A (也即，与： C 相加得 
2的 数)。 举个例子，若要找一对总和为12的数.那么， -5 的补数为17。 

现在，假设有这个已排好序的 数组： {-2 -1 0 3 5 6 7 9 13 14}。令 first 指向数组开头， 
last 指向数组结尾。要找出 first 的补数，就将 last 往回移动，直至找到补数。如果 first + last 
< sum , 则数组中不存在 first 的补数，因此可以向前移动 first , 等到 first 比 last 大时停止操作。 

为什么这么做就能找出 first 的所有补数？因为这个数组是排好序的，而且我们是从最小的 
数字开始逐一尝试的。当 first 与 last 的总和小于 sum 时，可以确定，就算继续尝试更小的数（像 
last 那样往回 移动） 也找不到补数。 
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为什么这么做可以找出 last 的所有补数？因为所有数值对必定由 first 和 last 组成。找出 
first 的所有补数，就等于找出了 last 的所有补数。 

1 void printPairSums(int[] array, int sum) { 

2 Arrays.sort(array); 

3 int first * 0; 

4 int last - array.length - 1; 

5 while (first < last) { 

6 int s * arrayffirst] + array[last]; 

7 if (s ■* sum) { 

8 Systea.out.printIn(array[first] + w w + array[last]); 

9 firsts; 



if (s < sum) first-M-; 



17.13 有个简单的类似结点的数据结构 BiNode , 包含两个指向其他结点的指针。数据 
结构 BiNode 可用来表示二叉树（其中 nodel 为左子结点. node 2 为右子结点）或双向链表（其 
中 nodel 为前趋结点， node 2 为后继结点)。编 写一个 方法.将二叉查找树（用 BiNode 实现）转 
换为双向链表。要求所有数值的排序不变，转换操作不得引入其他数据结构（即直接操作原先的 
数据结构)。（第105页） 


解法 

此题看似复杂，不过，运用递归就能实现得相当优美。要解决此题，你需要对递归有非常深 
刻的理解。 


设想有一棵简单的 二叉査找树: 


convert 方法应该将它转换成下面的双向 链表: 



下面我们会从根结点开始（结点 4), 以递归方式解决问題。 

我们知道，树的左右两半会在双向链表里形成它们自己的子部分（也即，它们在链表里的位 
置是连续的)。那么，若能以递归方式将左子树和右子树转换成双向链表，我们有办法从这些子 
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部分构建出最终的链表吗？ 

当然有！直接合并这两个子部分即可。 

相关伪码大致 如下： 

1 BiNode convert(BiNode node) { 

2 BiNode left = convert(node.left); 

3 BiNode right = convert(node.right); 

4 nergeLists(left, node, right); 

5 return left; // 左边的开头 

6 } 

为了实现上述伪码的琐碎细节，我们需要取得每个链表的表头和表尾，有以下几种做法。 


解法1:附加数据结构 

第一种，也是比较简单的一种方法，是创建一个 NodePair 数据结构，只包含链表的表头和 
表尾。然后， convert 方法就可以返回一个 NodePair 对象。 

下面是这种做法的实现代码。 

1 private class NodePair { 

2 BiNode head; 

3 BiNode tail; 

4 

5 public NodePair(BiNode head, BiNode tail) { 

6 this.head - head; 

7 this.tail - tail; 

8 > 

9 } 

10 

11 public NodePair convert(BiNode root) { 

12 if (root ― null) { 

13 return null; 

14 > 

15 

16 NodePair parti ■ convert(root.nodel); 

17 NodePair part2 = convert(root.node2); 

18 

19 if (parti !- null) { 

20 concat(parti.tail, root); 

21 } 

22 

23 if (part2 !» null) { 

24 concat(root, part2.head); 

25 } 

26 

27 return new NodePair(parti == null ? root : parti.head, 

28 part2 ■« null ? root : part2.tail); 

29 } 

30 

31 public static void concat(BiNode x, BiNode y) { 

32 x.node2 * y; 

33 y.nodel = x; 

34 } 







6 . 


BiNode parti ■ convertToCircular(root.nodel); 
BiNode part3 » convertToCircular(root.node2); 


8 

9 if (parti ** null &ft part3 »■ null) { 

10 root.nodel * root; 

11 root.node2 = root; 

12 return root; 

13 } 

14 BiNode tail3 ■ (part3 -■ null) ? null : part3.nodel; 

15 

16 /* 将左边加至根 V 

17 if (parti ■■ null) { 

18 concat(part3.nodel t root); 

19 > else { 

20 concat(parti.nodel 4 root); 

21 } 

22 

23 /* 将右边加至根 */ 

24 if (part3 ■- null) { 

25 concat(root, parti); 

26 } else { 

27 concat(root, part3); 

28 } 

29 

30 /* 将右边加至左边 •/ 

31 if (parti !■ null && part3 !- null) { 

32 concat(tail3, parti); 

33 } 

34 

35 return parti ― null ? root : parti; 

36 } 

37 

38 /* 将蛙 表特糗为坏形鍵表，然后斯开 

39 * 坏 形连接 V 

40 public static BiNode convert(BiNode root) { 

41 BiNode head > convertToCircular(root); 

42 head.nodel.node2 ■ null; 

43 head•nodel ■ null; 

44 return head; 

45 > 

注意，我们已将代 W 主体部分移至 convertToCircular , convert 方法会调用这个方法取得 
环形链表的表头，然后断开环状连接。 

这种做法需要用时 0( A <), 因为每个结点平均只会访问一次（或者，更准确地说，是 0(1) 次)。 

17.14 哦，不 I 你刚刚写好一篇长文.却倒霉地误用了 “ 查找 / 替换 ” ，不懊 ■ 除了文档中 
所有空格、标点，大写变成 /J\^ 。 比如，句子 u l reset the computer. It still didn't boot !" (我重 
后了电脑，但还没启动好 I ) 变成了 "iresetthecomputeritstilldidntboot” 。 你发现，只要能正确分 
离各个单词，加标点和调整大小写都不成问题。大部分单词在字典里都找得到，有些字符串如专 
有名词则找不到。 
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给定一个字典（一^单词），设计一个算法，找出拆 分一连 串单词的最佳方式。这里"最佳” 
的定义是，解析后无法辨识的字符序列越少趣5。 

举个例子，字符串 “ jesslookedjustliketimherbrother ” 的最佳解析结果为 “JESS looked just 
like TIM her brother ", 总共有 7 个字符无法辨别.全部显示为大写.以示区别。（第105页） 

解法 

有些面试官喜欢开门见山，给你具体的问题,也有的面试官喜欢告诉你一堆不必要的上下文， 
就像此题一样。遇到这种情况，最好将问题好好梳理一下，找出到底要做什么。 

此题的关键是要找到一种方法,将字符串拆分为几个单词,使得解析后剩下的字符越少越好。 
注意，我们并不打算试图去“理解”字符串， “ thisisawesome " 可以解析为 “this is awesome ", 
同样可以解析为 "this is a we some ”。 

此题的重点在于找到一种方法，从子问題的角度来定义问题解法（也即解析后的宇符串）。 
一种做法是递归访问整个字符串。在每个时间点上，最佳解析是从两种可能决定中择优而取。 

(1) 在这个字符后插人一个空格。 

(2) 不在这个宇符后插人一个空格。 

我们将以宇符串 thit 为例过一遍此题的解法，如下所示。为了淸楚起见，我们将使用以下 
记号： 

□ 无效单词 （ 字典里找不到的）全部 大写； 

□ 有效的单词加下 划线； 

□ 结合在一起的宇符 （ 宇符之间没有空格）加粗表示。 

这些在字符串里的加粗字符仍处于“待解析”的状态，我们还未决定这些字符是有效的还是 
无效的 （ 在字典中找不找得 到)。 

1 p(thit) 

2 ■ min(T + p(hit), p(thit)) -->1 inv. 

3 T + p(hit) = min(T + H ♦ p(it), T + p(hit)) —> 1 inv. 

4 T + H + p(it) = min(T + H + i + p(t), T + H ♦ p(lt)) --> 2 

5 T + H ♦ i ♦ p(t) »T + H + i + T = 3 Invalid 

6 T ♦ H ♦ p(it) =T+H+it=2 invalid 

7 T + p(hit) » min(T ♦ hi + p ⑴， T ♦ p(hit)) --> 1 inv. 

8 T + hi + p(t) - T + hi + T = 2 invalid 

9 T + p(hit) = T + hit ■ 1 invalid 

10 p(thlt) = min(TH + p(it), p(thit)) --> 2 inv. 

U TH + p(it) = min(TH ♦ i + p(t), TH + p(it)) —> 2 inv. 

12 TH + i + p(t) =TH+i+T=3 invalid 

13 TH + p(it) = TH ♦ it = 2 Invalid 

14 ' p(thit) = min(THI + p(t), p(thit)) —> 4 inv. 

15 THI + p(t) = THI + T = 4 invalid 

16 p(thit) = THIT = 4 invalid 

在上述步骤中，请注意每一层都分为两部分。第一部分分割字符串，而第二部分则进行 
结合。 

例如，当首次调用 p ( thit 〉 时，当前被解析的字符就是第一个 t , 会递归到两个方向。第一 
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个（第3行）会在 t 后面插入一^空白，然后试着找出解析 hit 的最佳 方式。 第二个（第1術）会 
试着找出 t 和 h 之间没有空内的最佳解析方式。重复执行上述动作，最终就会得到字符串所有可能 
的解析 方式。 

下面是该解法的实现代码。为了简单起见，我们实现该算法时只返回无效字符的个数。 

1 public int parseslmple(int wordStart, int wordEnd) { 

2 if (wordEnd >* sentence.length()) { 

3 return wordEnd - wordStart; 

4 > 

5 

6 String word » sentence.substring(wordStart J wordEnd + 1); 

7 

8 I ， 切断备前的单句 •/ 

9 int bestExact ■ parseSimple(MordEnd ♦ 1, wordEnd ♦ 1); 

10 if ( I dictionary.contains(Mord)) { 

11 bestExact Mord.length(); 

12 } 

13 

14 /• 扩展 SJ 前的单均 */ 

15 int bestExtend ■ parseSimple(wordStart, wordEnd ♦ 1); 

16 

17 /* 找出最值单 •/ 

18 return Hath.min(bestExact, bestExtend); 

19 } 

这段代码还吋以进行两处大的优化。 

□有些递归重复了。例如，在前面的解析示例中，我们重复计算了 it 的 最佳解 析方式。其 
实第一次算出來后就可以将结果缓存起来，以供之后使用。运用动态规划法就可以实现 
这一点。 

□在某些情况下，我们或许可以预测出某一个解析将产生无效字符串。例如，假设正试着 
解析字符串 xten ， 但并不存在以 xt 开头的单词。然而，目前的解法还是会尝试解析字符 
申为 rt + p ( en ) . xte + p ( n > 和 xteri 。 每一次都会发现这样的单词在字典里并不存在。 
相反，我们应该在 x 后面加上空白，并从这里开始进行最佳解析。不过，怎样才能快速判 
断不存在以 xt 开头的单词呢？答案是使用 trie , 

下面是上述两处优化的实现代码。 

1 public int parseOptimized(int wordStart, int wordEnd, 

2 Hashtable<Integer, Integer 》 cache) { 

3 if (wordEnd >= sentence.length()) { 

4 return wordEnd - wordStart; 

5 > 

6 if (cache.containsKey(wordStart)) { 

7 return cache.get(wordStart); 

8 } 

9 

10 String currentWord ■ sentence.substring(wordStart^ wordEnd +1); 

11 

12 /* 检査前蜒是否在字典里 （false --> # 分 £^> V 
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13 boolean validPartial » dictionary.contains(currentWord, false); 

14 

15 /* 切断当前的单匈 

16 int bestExact ■ parseOptimized(wordEnd * 1, wordEnd + 1, cache); 

17 

18 /* 若完整字符 ♦ 不在字典里，算作无效单均 •/ 

19 if (!validPartial || ! dictionary.contains(currentUord, true)) { 

20 bestExact += currentWord.length(); 

21 > 

22 

23 /* 扩展盎前的单 甸 •/ 

24 int bestExtend * Integer.MAX_VALUE; 

25 if (validPartial) { 

26 bestExtend * parseOptinized(wordStart > wordEnd + 1, cache); 

27 ) 

28 

29 I* 找出最佳单 句 V 

30 int min • Hath.min(bestExact, bestExtend); 

31 cache.put(wordStart, nln); // 緩并熗果 

32 return min; 

33 } 

注意，我们使用 / 散列表来缓存结果，键为单词开头的索引。也就是说，我们缓存的是字符 
串剩余部分的最佳解析方式。 

我们可以调整代码，返回解析后的完整宇符串，但这样做稍微有点复杂。我们需要使用名为 
Result 的包裹类，这样才能同时返回无效字符的个数和最佳字符串。要是以 C ++ 实现的话，只需 
按引用传值。 

public class Result { 

public int invalid - Integer.HAX_VALUE; 
public String parsed ■ 
public Result(int inv ， String p) { 
invalid ■ inv; 
parsed = p; 

> 

8 



public Result clone() { 
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55 


if (wordEnd >= sentence.lengthO) { 
return new Result(wordEnd - wordStart, 

sentence.substring(wordStart).toUpperCase()); 

} 

if (cache.containsKey(wordStart)) { 
return cache.get(wordStart).clone(); 

> 

String currentWord - sentence.substring(wordStart 4 wordEnd + 1); 
boolean valldPartial » dictionary.contains(currentWord, false); 
boolean validExact ■ valldPartial 

dictionary.contains(currentWord , true); 

/• 切断盏莳的单詞 V 

Result bestExact ■ parse(v#ordEnd ♦ 1, wordEnd ♦ 1, cache); 
if (validExact) { 

bestExact .parsed « currentWord bestExact. parsed; 

> else { 

bestExact•invalid currentWord.length(); 

bestExact.parsed = currentWord.toUpperCase() + ~ ♦ 

bestExact.parsed; 


/• 扩展的单均 •/ 

Result bestExtend ■ null; 
if (valldPartial) { 

bestExtend ■ parse(wordStart, wordEnd ♦ 1, cache); 


/* 找出最单 •/ 

Result best » Result.nin(bestExact, bestExtend); 
cache.put(wordStart, best.clone()); 
return best; 


在动态规划问題中，对于如何缓存对象，要非常小心。若缓存的东西是对象而非基本数据类 
型，很可能需要复制该对象。这可以从上面第30〜55行代码看出。如果不加复制，后续对 parse 
的调用就会篡改缓存里的值。 


9.18 高难度题 


18.1 编写一个函数.将两个数字相加。不得使用+或其他算术运篱符。（第105页） 

解法 

遇到这类问题，第一反应是我们需要跟比特位打交道，八九不离十。何出此言？原因很简单, 
连加号 （+ ) 都不能用了，还有其他选择吗？再说了，计算机在计算时就是跟比特位打交道的。 

接下来，我们应该着眼于切实理解加法是怎么工作的。我们可以过一遍加法问题，看看自己 
能否悟出新东西——某种模式，然后，试试能否用代码来实现。 

闲话少说，下面就来探讨一个加法问题，并以十进制运算，这样更容易理解。 
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要做 7 S 9 + 674加法运算，通常会将每个数字的个位数 （ digit [0]) 相加、 进位, 然后将每 
个数字的十位数 （ digit [ l ]) 相加、进位，依此类推。二进制加法也可以采取同样的做 法：各 
位数相加，必要时进位。 

有没有办法让程序简单一点呢？当然有！设想一下，把“相加”和“进位”等步骤分开，也 
就是说，.像下面这么做。 

(1) 将759和674相加，但“忘了”进位，得到323。 

(2> 将759和674相加，但只进位，不会将各位数加在一起，得到1110。 

(3) 将前面两步操作的结果加起来——递归执行步骤 (1) 和步骤 (2) 描述的 过程： 1110 + 323 = 
1433。 

那么，对于二进制，该怎么做？ 

(1) 若将两个二进制数加在一起，但忘记进位，只要 a 和6的》•位相同（皆为0或皆为 1), 总和 
的 i 位就为0。这实质上就是异或操作 （ XOR )。 

(2) 若将两个数字加在一起，但只进位.只要^和6的卜 I 位皆为 1. 总和的/位就为1。这实质上 
就是位与 （ AND ) 加上移位操作。 

(3) 接着，递归执行步骤⑴和 (2), 直至没有进位为止。 

下面是该算法的实现代码。 

1 public static int add(int a, int b) { 

2 if (b ■■ 0) return a; 

3 int sura 囂 a A b; // 相加位不进位 

4 int carry - (a & b) « 1; // 进位，钽不相加 

5 return add (sum, carry); // 递归 

6 > 

要求我们实现基本算术运算，比如加法和减法，这类问题比较常见。这些问题的关键在于深 
入挖掘这些运算通常是怎么实现的，这样就可根据给定问题的限制重新实现相关运算。 

18.2 编写一个方法.洗一副牌。要求做到完美洗牌，换言之，这副牌52!种排列组合出现 
的概率相同。假设给定一个完美的随机数发生器。（第106页） 


解法 

这个面试题非常有名，算法也很知名。掌握这个算法的人却不多，如果你还不是其中之一， 
还请继续往下看。 

假定有个数组，含;^元素，类似 如下： 

[1] [2] [3] [4] [5] 

利用简单构造法，我们不妨先问问自己：假定有个方法 shuffle (...) 对/» - 1个元素有效， 
我们可以用它来打乱#元素的次序吗？ 

当然可以，而且非常容易实现。我们会先打乱前/»-1个元素的次序， 然后， 取出第；》个元素， 
将它与数组中的元素随机交换。就这么简单！ 

递归解法的算法类似如下： 
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1 /* lower 和 higher ( 含〉 之间的随机数 V 

2 int rand(int lower, int higher) { 

3 return lower + (int)(Math.random() * (higher - lower + 1)); 

4 > 

5 

6 int[] shuffleArrayRecursively(int[] cards, int i) { 

7 if (i ■■ 0) return cards; 

8 

9 shuff leArrayRecursively (cards, i • 1>; // 打氣先酧部分的次数 

10 int k « rand(0, i); // 随机挑选索 U 进行交抽 

11 

12 /* 交换元索 k 和 i */ 

13 int temp ■ cards[k]; 

14 cards[k] - cards[i]; 

15 cards[i] - temp; 

16 

17 /* 返田元素次序被打虬的數 fe */ 

18 return cards; 

19 > 

以迭代方式实现的话，这个算法又会是什么样？让我们先考虑一下。我们要做的就是遍历幣 
个数组，对每个元素/,将 array [ i ] 与0和 /( 含）之间的随机元素交换。 

其实，这个算法一点也不绕，很适合以迭代方式 实现： 

1 void shuffleArrayInteratively(int[] cards) { 

2 for (int i ■ 0; i < cards.length; { 

3 int k = rand(0 # i); 

4 int temp ■ cards[k]; 

5 cards[k] » cards[i]; 

6 cards[i] ■ temp; 

7 > 

8 > 

这样就可以用迭代法实现 该算法 f 。 

18.3 编 写一个 方法，从大小为 /7 的数组中随机选出 m 个整数。要求每个元素被选中的概 
率相同。（第106页） 

解法 

与 18.2 类似，我们可以利用简单构造法，以递归方式处理此题。 

假定有个算法可以从包含 n - 1个元素的数组中随机抽出 m 个元素，我们可以使用该算法从包 
含《个元素的数组中随机抽出 iw 个元素吗？ 

我们可以先从前 - 1个元素中随机抽出 m 个元素。然后，只需决定 array [ n ] 是否应该插人 
subset (从中随机抽出一个元素)。一种简单的做法是从0到》中随机挑选一个数紇若 ； fc < m ，则 
将 array [ n ] 插人 subset [ k ]。 将 array [ n ] 插人 subset (按比例概率）以及从 subset 中随机移除 
一个元素，两者都很“ 公平' 

这个递归算法的伪码大致如下： 

1 int[] pickMRecursively(int[] original, int m, int i) { 
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if (i + 1 « m) { // 终止条件 
/* 返田 original 数組的酋 m 个元素 */ 

> else if (i + m > _) { 

int[] subset ■ pickHRecursively(original, n, i • 
int k = random value between 0 and inclusive 
if (k < m) { 

subset[k] * original[i]; 

> 

return subset; 

) 

return null; 

这个算法的迭代实现写起来更明晰。在这种做法中，我们会先创建数组 subset ， 并将它初始 
化为 original 数组的前 w 个元素。然后，从元素 m 开始，迭代访问 original 数组，只要 A :< m , 就 
将 array [ i ] 插人 subset 数组的（随机选出的） 位置 k 0 

1 int[] pickMIteratively(int[] original, int in) { 

2 int[] subset - new 
B 

4 /* 用 original 数組的前 m 个元索填入 subset •/ 

5 for (int i ■ 0; i < ■ ; i++) { 

6 subset[i] - original[i]; 

7 > 

8 

9 /• 访问 original 敎纽的余元縈 V 

10 for (int i - m; i < original.length; i++) { 

11 int k - rand(0, i); // 取得 0 到 i ( 含） 之间的随机数 

12 if (k < n) { 

13 subset[k] * original[i]; 

14 } 

15 > 

16 

17 return subset; 

18 } 

一点也不奇怪，这两个解法与打乱数组的算法非常相似。 

18.4 编写一个方法，数出0到 n ( 含）中数字2出现了几次。（第106页） 

解法 

面对此题，我们想到的第一种做法会是，也应该是蛮力法。记住，面试官希望看到你是怎么 
解题的，先给出蛮力解法也是非常不错的开始。 

1 /* 数一数0到 n 中数字2出现的次数 •/ 

2 int nu«berOf2sInRange(int n) { 

3 int count * 0; 

4 for (int i 臆 2; i <= n; i++) { // 不妨 支接从 2 开始 

5 count += number0f2s(i); 
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9 

10 /* 数出某个数字中有几个2 */ 

11 int numberOf2s(int n) { 

12 int count = 0; 

13 while (n > 0) { 

14 if (n % 10 == 2) { 

15 count++; 

16 } 

17 n « n / 10; 

18 } 

19 return count; 

20 } 

其中有个地方应该注意，就是最好将 mimb e r 0 f 2 s 独立写成一个方法，这样一来，代码也许 
更加清晰，也会展现出你注重代码的干净齐整。 


改进后的解法 

之前的解法是从-个范围内的数字来看，现在我们从数字的毎个位来观察问题。假设有下面 
一个数宇 序列： 

0123456789 
10 11 12 13 14 15 16 17 18 19 
20 21 22 23 24 25 26 27 28 29 

110 111 112 113 114 115 116 117 118 119 

由观察可知，每10个数字中，最后一位为2的情况大概会出现一次，因为2在连续10个数中都 
会出现一次。实际上，任意位为2的概率大概是1/10。 

之所以说“大概”，是因为存在边界条件（非常常见)。例如，在1到100之间，十位数为2的 
概率正好为1/10。然而，在1到37之间，十位数为2的概宇就会比1/10还大。 

下面逐一分析 digit < 2 、 digit = 2和 digit > 2三种情况，就能算出准确的比率。 

• 情况 h digit <2 

以 x ■ 61 523和(1 = 3为例，可以宥出 x [ d ] = 1 ( 也即 x 的第 d 位数为1 )。第3位数为2的范围 
是2000 - 2999、 12 000-12 999、 22 000-22 999、 32 000-32 999、 42 000-42 999 
和52 000 - 52 999,还没到范围62 000 - 62 999,因此第3位数总共有6000个2。这个数虽等 
于范围1到60 000里第3位数为2的数 * 。 

换句话说，我们可以将原来的数往下降至最近的 lO ^ 1 , 然后再除以10,就可以算出第 d 位数 
为2的数量。 

if x [ d ] < 2: count 2 sInRangeAtDigit ( x , d )= 
let y = round down to nearest lO * 1 * 1 
return y /10 

參情况 2: digit >2 

现在，我们再来看看 x 的第 d 位数大于 2( x [ d ] > 2 > 的情况 c 基本上，我们可以运用之前相 
同的逻辑，确认范围0 - 63 S 25 里第3位数为2的数量与范围0 - 70 000是相同的。因此，之前 
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是往下降，现在是往上升。 


if x[d] > 2: count2sInRangeAtDigit(x, d)= 
let y = round up to nearest lO^ 1 
return y /10 
► 情况 3: digit = 2 


最后这种情况可能是最棘手的，不过仍可套用之前的逻辑。以 X = 62 523和(1 = 3为例，由 
之前的逻辑可得到相同的范围（也即范围2000 - 2999,12 000 - 12 999,…，52 000 - 52 999)。 
在最后余下的62 000 - 62 S 23 这个局部范围里，第3位数为2的数量有多少？其实，再显而易见 
不过了 O 只有524个 （62 000,62 001, .... 62 523)。 


if x[d] > 2: count2sInRangeAtDigit(x, d)= 
let y = round down to nearest lO** 1 
let z = right side of x (i.c., x % ID 1 *) 
return y / 10 + z + 1 

现在，只需迭代访问数字中的每个位数。相关代码实现起来相当直接。 


1 public static int count2sInRangeAt01git(int nunber, int d) { 

2 int powerOfl0 ■ (int) Math.pow(10, d); 

3 int nextPowerOfie = powerOfie • 10; 

4 int right « number X powerOfie ； 

5 

6 int roundDown ■ number - number X nextPowerOfie ； 

7 int roundup ■ roundDown ♦ nextPowerOflO; 

8 

9 Int digit ■ (number / povierOflO) % 10; 

10 if (digit < 2) { // 若 Itdigit 位數 

11 return roundDown / 10; 

12 } else if (digit -- 2) { 

13 return roundDoMn / 10 ♦ right ♦ 1; 

14 } else { 

15 return roundUp / 10; 

16 > 

17 ) 

18 

19 public static int count2sInRange(int number) { 

20 int count ■ 0; 

21 int len = String.valueOf(nunber).length(); 

22 for (int digit = 0; digit < len; digit—) { 

23 count ♦= count2sInRangeAtDigit(nuaber, digit); 

24 } 

25 return count; 

26 } 

解决此题时，需要进行非常仔细的测试，务必列全一系列的测试用例，然后逐一测试 
验证。 
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18.5 有个内含单词的超大文本文件，给定任意两个单词.找出在这个文件中这两个单 
词的最短距离（也即相 H 5 几个单词)。有办法在 0(1) 时间里完成搜索操作吗？解法的空间 S 杂度 
如何？（第106页） 


解法 

在此题中，我们假设单词 wordl 和 W0fd2 谁在前谁在后无关紧要，当然最好与面试官确认能 
否做此假设。若考虑单词前后顺序的话，那么，下面给出的代码需要稍作调整《 

要解决此题，我们只需遍历一次这个文件。在遍历期间，我们会记下最后看见 wonll 和 word2 
的地方，并把它们的位置存人 lastPosWordl 和 lastPosWord2 中。碰到 wordl 时，就拿它跟 
lastPosWord2 比较，如有必要则更新 min, 然后更新 lastPosWordl 。 而每当碰到 word2 时，我们 
也会执行同样的操作。遍历结束后，就可得到最短距离 n 
下面是该算法的实现代码。 

>lic int shortest(String[] words ， String wordl ， String word2) { 
int _in ■ Integer.MAX_VALUE; 
lnt lastPosWordl - -1; 
int lastPosWord2 - -1; 
for (int i - e ； 1 < words.length; i-f+) { 

String currentWord ■ words[i 】； 
if (currentWord.equals(wordl)) { 
lastPosWordl ■ i; 

// 若要区則单 均 的前后順序 . 注掉下由 3 行 
int distance - lastPosWordl - lastPosUord2; 
if (lastPosWord2 >■ 0 && nin > distance) { 
min ■ distance; 

> 

} else i-f (currentMord.equals(word2)) { 
lastPosMord 2 ■ 1; 

int distance ■ lastPosWord2 - lastPosWordl; 
if (lastPosWordl >■ e && nin > distance) { 
min - distance; 


return min; 

如果上述代码要被重复调用（査询其他单词对的最短距离），可以构造一个散列表，记录每 
个单词及其出现的位置。然后，我们只需找出 listA 和 listB 中（算术）差值最小的那两个值。 
计算 listA 和 listB 中元素最小差值有好几种方法，以下面的列表为例： 

listA: {1, 2, 9, 15, 2S} 
listB ： {4, 10, 19} 

将这两个列表合并为一个列表并排序，在每个数字后面打上标记，标明取自哪个列表。打标 
记时可将每个值封装在一个类里，这个类有两个成员 变量 ： data (储存实际值）和 listNumber 。 
list : { la , 2 a , 4 b , 9a, 10b, 15 a , 19 b , 25 a > 
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现在，想要找出最短距离的话，只需遍历合并后的列表，査找两个取自不同列表的连续数字 
且它们之间的差为最小值。在上面的例子中，答案是最短距离为1 (在和 10 A 之间)。 

18.6 设计一个算法，给定10亿个数字，找出最小的100万个数字。银定计算机内存足以 
容纳全部10亿个数字。（第106页） 


解法 

此题有很多种解法，下面将介绍其中 三种： 排序、小顶堆和选择排序 （ selectionrank )。 
解法1:排序 

按升序排序所有元素.然后取出前100万个数。时间复杂度为 log (/0)。 


解法2:小顶堆 

我们可以使用小顶堆来解题。首先，为前100万个数字创建一个大顶堆（最大元素位于堆顶)。 
然后，遄历整个数列，将每个元素插人大顶堆，并删除最大的元素。 

遍历结束后，我们将得到一个堆，刚好包含最小的100万个数字。这个算法的时间复杂度为 
0 {n log ( m )), 其中 m 为待査找数值的数址。 

解法3:选择排序算法（假如你可以修改原始数组） 

在计算机科学中，选择排序是个很有名的算法，可以在线性时间内找到数组 中第/ 个最小（或 
最大）元素。 

如果这些元素各不相同，则可在预期的0(/»)时间内找到第/个最小的元素。该算法的基本流程 
如下。 

(1) 在数组中随机挑选一个元索，将它用作 “ pivot ” （基准)。以 pivot 为基准划分所有元素， 
记录 pivo 佐边的元素个数。 

(2) 如果左边刚好有 i 个元素， 则直接返回左边最大的元素。 

(3) 如果左边元素个数大于则继续在数组左边部分重复执行该算法。 

(4) 如果左边元素个数小于则在数组右边部分重复执行该算法，但只査找排 i_-leftSize 的那 

个元素。 

下面是该算法的实现 代码。 

1 public int partition(int[] array, int left, int right, int pivot) { 

2 while (true) { 

3 while (left <* right &A array[left] <= pivot) { 

4 left-M-; 

5 > . 

6 

7 while (left <= right && array[right] > pivot) { 

8 right—; 
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13 > 

14 swap(array, left, right); 

15 } 

16 } 

17 

18 public int rank(int[] array, int left, int right, int rank) { 

19 int pivot ■ array[randomlntInRange(left, right)]; 

20 

21 /• 分割， 返田左边部分的结毛 •/ 

22 int leftEnd ■ partition(array, left, right, pivot); 

23 

24 int leftSize - leftEnd - left + 1; 

25 if (leftSize ■- rank ♦ 1) { 

26 return nax(array, left, leftEnd); 

27 > else if (rank < leftSize) { 

28 return rank(array, left, leftEnd, rank); 

29 > else { 

30 return rank(array, leftEnd ♦ right, rank - leftSize); 

31 > 

32 } 

一旦找到第 / 小的元素，你就可以遍历整个数组，找到所有小于或等于该元素的值。 

如果这些元索有重复值（一般不大可能)，就需要对这个算法略作调整，以适应这一变化。 
不过.这样一来，就不能保证算法执行时间的上 限了。 

有个算法可以保证在线性时间内找到第 f 小的元索，无论元素有无重复值。然而，这个算法 
的复杂度远远超出了面试的范围。若有兴趣的话，请参考 CLRS 四人合著的（算法 导论》 一书。 

18.7 给 定一组 单词，编 写一个 程序，找出其中 的最长 单词.且该单词由这组单词中的其 
他单词组合而成。（第106页） 

解法 

此题看似比较复杂，让我们先来简化一番。如果只是想知道由列表中的其他两个单词组成的 
最长单词，该怎么处理？ 

我们可以通过遍历整个列表，从最长单词到最矩单词，将每个单词分割成所有可能的两半， 
然后检査左右两半是否在列表中。 

上述做法的伪码大致 如下： 

1 String getLongestWord(String[] list) { 

2 String[] array * list.SortByLength(); 

3 /* 创建 map 以便查找 V 

4 HashMap<String > Boolean> map = new HashMap<String, Boolean〉； 

5 

6 for (String str : array) { 

7 map.put(str, true); 

8 > 

9 

10 for (String s : array) { 

11 // 切分成所有可能的两半 

12 for (int i ■ 1; i < s.length(); i++) { 
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13 String left = s.substring(6 J i); 

14 String right * s.substring(i); 

15 // 搶查左右两半是否在数妞中 

16 if (nap[left] == true && nap[right 】 *= true) { 

17 return s; 

18 } 

19 > 

20 > 

21 return str; 

22 } 

若知道最长单词由另外两个单词组合而成时，这么做非常有效。但是，若单词可以由任意数 
量的其他单词组成，又会怎么样呢？ 

在这种情况下，我们可以采用非常相似的做法.只修改 一处： 之前会检査右半部分是否在数 
组中，现在改为递归检査右半部分可否由数组其他元素构建出来。 

下面是该算法的实现 代码： 


1 String printLongestWord(String arr[]) { 

2 HashMap<String, Boolean 〉 map » new HashMap<String > Boolean》（>; 

3 for (String str : arr) { 

4 map.put(str, true); 

5 } 

6 Arrays.sort(arr, new LengthCo«parator()); // 按长度排序 

7 for (String s : arr) { 

8 if (canBuildWord(s, true, map)) { 

9 Sy steii. out. println( s); 

10 return s; 

11 > 

12 > 

13 return 

14 } 

15 

16 boolean canBulldWord(String str, boolean isOrlginalWord, 

17 HashMap<String, Boolean 》 map) { 

18 if (nap.contalnsKey(str) &ft lisOrlginalWord) { 

19 return map.get(str); 

20 > 

21 for (int 1 - 1; i < str.length(); i^-f) { 

22 String left » str.substrlng(0, i); 

23 String right « str.substring(i); 

24 if (map.containsKey(left) && map.get(left) true && 

25 canBuildWord(right, false, map)) { 

26 return true; 

27 } 

28 > 

29 map.put(str, false); 

30 return false; 

31 } 


注意，在这个解法中，我们做了一个小小的优化。我们使用动态规划方法缓存了多次调用之 
间的结果。这样一来，如需反复检査有无办法构造 - tesringtester ", 就只需要计算一次。 
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其中，布尔标志 isOriginalWord 用于完成上面的优化 D 调用方法 canBuildWord 时，会传人原 
始单词和每个子串’在算法里，第一步会先检査缓存里有无之前计算好的结果。但是，这里也有个 
问题： 对于原始单词， ma # 将这些单词初始化为 true , 但我们又不想返回 true (因为单词不能只 
由它本身组成)。因此，对于原始单词，我们会利用 isOriginalWord ^ 志直接跳过这项检査。 

18.8 给定一个字符串 s 和 一个包 含较短字符串的数组 T . 设计一个方法.根据 T 中的毎 
—个较短字符串，对 s 进行搜索。（第106页） 

解法 

首先，创建 S 的后缀树 （ suffixtree )。 举个例子，若单词为 bibs , 则这棵树如下 所示： 



然后，只需在这棵后缀树中搜索杳找 T 中的每个字符串。注意.如果 “ B " 是个单词的话, 
你会得到两个位置。 

1 public class SuffixTree { 

2 SuffixTreeNode root ■ new SuffixTreeNode(); 

3 public SuffixTree(String s) { 

4 for (int i ■ 0; i < s.length(); { 

5 String suffix - s.substring(i); 

6 root.insertString(suffix, i); 

7 } 

8 > 

9 

10 public ArrayLlst<Integer> search(String s) { 

11 return root.search ⑴； 

12 } 

13 > 

14 

15 public class SuffixTreeNode { 

16 HashMap<Character, SuffixTreeNode 〉 children = new 

17 HashMap<Character, SuffixTreeNode 〉 

18 char value; 

19 ArrayList<Integer> indexes = new ArrayList<Integer>(); 
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public SuffixTreeNode() { } 

public void insertString(String s, int index) { 
indexes.add(index); 
if (s !* null && s.length() > 0) { 
value = s.charAt(0); 

SuffixTreeNode child ■ null; 
if (children.containsKey(value)) { 



child - new SuffixTreeNode(); 
children.put(value, child); 


String remainder = s. substring ⑴； 
child.insertString(remainder« index); 


public ArrayList<Integer 〉 search(String s) { 
if (s 蠤騰 null 11 s•length(〉■■ 0 > { 
return indexes; 



char first ■ s.charAt(O); 
if (children.containsKey(first)) { 

String renainder - s. substring ⑴； 

return children.get(first).search(remainder); 



18.9 随机生成一些数字并传入某个方法。 蝙写一个 程序.每当收到新数字时.找出并记 
录中位数。（第106页） 


解法 

种 解法是使用两个优 5 t 级堆 （priority heap ): —个大顶堆，存放小于中位数的值，以及一 
个小顶堆，存放大于中位数的值。这会将所有元素大致分为两半，中间的两个元索位于两个堆的 
堆顶。这样一来，要找出中位数就是小事一桩。 

不过，"大致分为两半”又是什么意思呢？ “大致”的意思是，如果有奇数个值，其中一个 
堆就会多一个值。经观察 SI 知，以下两点为真。 

口 如果 maxHeap.sizeO > minHeap . size (), 则 maxHeap . top (> 为中位数。 

□ 如果 maxHeap . size () == minHeap . size () ,则 maxHeap . top () 和 minHeap . top (〉 的平均 
值为中位数。 

当要重新平衡这两个堆时，我们会确保 maxHeap —定会多一个元素。 

这个算法说明如下。有新的值生成时，如果这个值小于等于中位数，则放人 maxHeap 中，否 
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则放人 minHeap 。 两个堆的元素个数相等，或者 maxHeap 可能多一个元素。这个限制条件很容易 
得到保证，不满足的话，只要从一个堆搬移一个元素到另一个堆即可。通过査看 maxHeap 或两个 
堆的堆顶元素，就能以常数时间获取中位数，而更新操作的用时为 0( log («))。 

1 private Conparator < Integer> maxHeapConparator; 

2 private Conparator<Integer> minHeapComparator; 

3 private PriorityQueue<Integer 〉 maxHeap, minHeap; 

4 

5 public void addNewNumber(int randomNumber) { 

6 /• 注意： addNewNumber 会保持下 ft 的条 件： 

7 • maxHeap.sizeO >- ainHeap.size() •/ 

8 if (maxHeap.sizeO ■■ ninHeap.size(>) { 

9 if ((aiinHeap.peek() !■ null) && 

10 randonNumber > ninHeap.peek()) { 

11 maxHeap.offer(minHeap.poll()); 

12 minHeap.offer(randonNunber); 

13 } else { 

14 maxHeap.offer(randonNunber); 

15 > 

16 } else { 

17 if(randonNumber < naxHeap.peek()) { 

18 minHeap.offer(MaxHeap.poll()); 

19 maxHeap.offer(randomNunber); 

20 ) 

21 else { 

22 minHeap.offer(randomNunbe r); 

23 > 

24 > 

25 > 

26 

27 public static double getHedian() { 

28 /• maxHeap 至少会 iMinHeap — 样大，因此，若 maxHeap 

29 * 为空， «»inHeap 也为空 V 

30 if (maxHeap.isEnptyO) { 

31 return 0; 

32 } 

33 if (maxHeap.sizeO ■■ minHeap.size(>) { 

34 return ((double)minHeap.peek()4>(double)naxHeap.peek()) / 2; 

35 > else { 

36 /• 若 maxHeap 与 minHeap 大小不网，縟么， 

37 * maxHeap 必定多一个元索 . 返回 maxHeap 

38 * 的堆項元素 •/ 

39 return naxHeap.peek() ; 

40 > 

41 } 

18.10 给定两个字典里的单词，长度相等。编写一个方法，将4单词变换成另一个单词， 
—次只改动一 T 字母。在变换过程中.每一的新里词都必须是字典里存在的。（第106页） 

解法 

此题看似困难，其实只要将广度优先搜索稍作修改就可以解出来。在“图”中，每个单词的 
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所有分支，都是在字典里相差一个字母的单词。有趣的地方在于实现，特别是，我们能一边实现 
一边构建这张图吗？ 

可以，但是有个更简单的方法。我们可以用一张“回溯地图”。在这张回溯地图中，如果 B [ v ] 
= w , 则表示编辑 v 可得到 w 。 到达终点单词时，可以不断地使用这张回溯地图，往回找出路径。 
请看下面的代码： 
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if (c != word.charAt(i)) { 
wordArray[i] = c; 
words.add(new String(wordArray)); 



假设 《 为初始单词的长度， m 为字典里相同长度的单词 个数。 其中 while 循环最多会拿出 m 个不 
同的单词，故此算法的运行时间为 0( wn )。 foHl 环要迭代访问整个字符串，并对每个字符施以 
固定次数的替换操作.时间复杂度为 0( n )。 

18.11 给定一个方阵，其中每个单元（像素）非黑即白。设计一个算法，找出四条边皆为 
黑色像素的最大子方阵。（第106页） 


解法 

和许多问题一样，此题也有难易两种解法，下面将逐一讲解。 

1. “简单” 解法： 0(//) 

我们知道最大子方阵的长度可能为 V ,而且 AfxMW 方阵只有一个，很容易就能检査这个方阵. 
符合要求则返回。 

如果找不到 AfxiV 的方阵，可以尝试第二大的子 方阵： ( A ^- l ) x ^- l ) 0 我们会迭代所有该尺寸 
的方阵，一旦找到符合要求的子方阵，立即返回。如果还未找到，则继续尝试 W -2、 N - 3 , 等等。 
由于我们是从大到小逐级搜索方阵，因此第一个找到的必定是最大的方阵。 

代码具体如下： 


1 Subsquare findSquare(int[][] natrix) { 

2 for (int i » natrix.length; i >■ 1 ; i--) { 

3 Subsquare square ■ findSquareWithSize(natrix, i); 

4 if (square I * null) return square; 



9 Subsquare findSquareMithSize(int[][] Matrix, int squareSize) { 

10 /* 外边为 N 时，置头会有 （N • sz ♦ 1 〉个边长 

11 - 为 sz 的方阵 》/ 

12 int count = matrix.length - squareSize 4 - 1; 


/* 迭代所有边长为 squareSize 的方阵 */ 
for (int row * 0 ; row < count; row++) { 
for (int col * 0 ; col < count; col++) { 

if (isSquare(matrix, row, col, squareSize)) { 
return new Subsquare(row, col, squareSize); 
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23 } 

24 

25 boolean isSquare(int[][] matrix, in ， 

26 // 捡査上边界和下边界 

27 for (int j * 0; j < size; j++){ 

28 if (matrix[row][col+j] == 1 ) { 

29 return false; 


: size) 


(matrix[row+size-l][col+j] 
return false; 


■ 1 ){ 


// 检臺左边界和右边界 
for (int i 騰 1; i < size • 1; i++){ 
if (matrix[row+i][col] »» 1){ 
return false; 


(matrix[rovH-i][col+size-l] 
return false; 


1H 


2 .预处理 解法： 0(/^) 

上面的“简单"解法之所以执行速度慢，很大一部分原因在于，每次检査一个可能符合要求 
的方阵，都要执行 0 (AO 的工作。通过预先做些处理，就可以把 isSquare 的时间复杂度降为 0(1), 
而整个算法的时间复杂度降至 0( Y >。 

仔细分析 isSquare 的具体用处，就会发现它只需知道特定单元下方及右边的 squareSize 项 
是否为零。我们可以预先以直接、迭代的方式算好这些数据。 

我们从右到左、自下而上迭代访问每个单元，并执行如下 计算： 

if A[r][c] is white, zeros right and zeros below are 0 
else A[r][c].zerosRight * A[r][c + l].zerosRight + 1 
A[r][c].zerosBelow * A[r + l][c].zerosBelow + 1 

下面这个例子给出了 •个矩阵的相关值。 • 


(0s right, 0s below) 


0,0 1 

1,3 

0,0 

2,2 

1,2 

0,0 

2,1 

1,1 

0,0 


Original Matrix 


现在， isSquare 方法不必再迭代0(外个元素，只需检査角落的 zerosRight 和 zerosBelow 即可。 
下面是该算法的实现代码。注意， findSquare 和 findSquareWithSize 基本相同，除了前者 
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调用了 processSquare® 以及之后操作新的数据类型。 

1 public class SquareCell { 

2 public int zerosRight = 0; 

3 public int zerosBelow * 0; 

4 /* 声明、 getter, setter •/ 

5 > 

6 

7 Subsquare findSquare(int[][] matrix) { 

8 SquareCell[][] processed = processSquare(Matrix); 

9 for (int i « matrix.length; i >- 1; i--) { 

10 Subsquare square » findSquareWithSize(processed, i); 

11 if (square !■ null) return square; 

12 > 

13 return null; 

14 } 

15 

16 Subsquare findSquareWithSize(SquareCell[][] processed, 

17 int squareSize) { 

18 /* 与 蓽 一个算法相 《 V 

19 } 

20 
21 

22 boolean isSquare(SquareCell[][] natrix, int row, int col, 

23 int size) { 

24 SquareCell topLeft ■ matrix[row][col]; 

25 SquareCell topRight ■ matrix[row][col + size - 1]; 

26 SquareCell bottomLeft ® matrix[row * size - l][col]; 

27 if (topLeft.zerosRight < size) { // 松査 上边界 

28 return false; 

29 > 

30 if (topLeft.zerosBelow < size) { // 松壹 左边界 

31 return false; 

32 > 

33 if (topRight.zerosBelow < size) { // 检査 右边界 

34 return false; 

35 } 

36 if (bottomLeft.zerosRight < size) { // 桧查 下边界 

37 return false; 

38 } 

39 return true; 

40 } 

41 

42 SquareCell[n 】 processSquare(int[][] Matrix) { 

43 SquareCell[][] processed - 

44 new SquareCell[natrix.length][matrix.length]; 

45 

46 for (int r * Matrix.length - 1; r >■ 0; r--) { 

47 for (int c - matrix.length - 1; c >* 0; c--> { 

48 int rightZeros * 0; 

49 int belowZeros » 0; 


①原文误为 processMatrix 。 - 译者注 
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// 

if 


只有单元为黑色时才需处理 
(«atrix[r][c] == 0 ) { 
rightZeros++; 


//下一列在同一行上 


if (c + 1 < matrix.length) { 

SquareCell previous = processed[r][c ♦ 1 】； 
rightZeros += previous.zerosRight; 

} 

if (r ♦ 1 < Matrix. length) { 

SquareCell previous ■ processed[r ♦ l 】 [c 】； 
belowZeros +3 previous.zerosBelow; 


processed[r][c] * new SquareCell(rightZeros ， belowZeros); 

> 

> 

return processed; 


18.12 给定一个正整数和负整数组成的 A / xA / 矩阵，編写代码找出元素总和最大的子矩阵。 
(第106页） 


解法 

此题有很多种解法，我们先从蛮力法开始，并在此基础上进行优化。 


1■蛮 力法： 0( W 6 ) 

跟许多“求最大值"问超一样，此题也有个简单的蛮力解法。这种解法就是直接迭代所有可 
能的子矩阵，计箅元素总和，找出最大值„ 

要迭代所有可能的子矩阵（且不重复），只：迭代所有的有序行配对，然后迭代所有的有序 
列配对。 

由于要迭代 0( V ) 个子矩阵，计算每个子矩阵的元素总和用时 0( A ^), 因此，这个解法的时 
间复杂度为0(^*)。 

2 •动牵规 划法： 0 { N *) 

注意到前面的解法被拖慢了 ©(/ V 2 ), 只怪矩阵元素总和的计算太慢。有办法减少元素总和计 
算的用时吗？当然有！事实上， computeSum 的用时可以降至0(1)。 

考虑下面的 矩形： 

xl x 2 


yi -—— 

y2 — B ___ 
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假设我们知道下面这些值： 

ValD * area(point(0, 0) -> point(x2, y2)) 

ValC = area(point(0, 0) -> point(x2, yl)) 

ValB ■ area(point(0, 0) -> point(xl, y2)) 

ValA = area(point(0, 0) -> point(xl ， yl)) 

每个 Val * 都从原点开始，在子矩形的右下角结束。 

利用这些值.可得到以下 等式： 

area(D) - ValD - area(A union C) - area(A union B) 4 - area(A) 

或者，换一种 写法： 

area(O) • ValD - ValB - ValC + ValA 

利用类似的逻辑，就可以有效地为矩阵里的所有点算出这 些值: 


Val(x, y) = Val(x - 1, y) ♦ Val(x, y - 1) - Val(x - 1, y - 1) ♦ H[x][y] 
我们可以预先算好这些值，然后就能迅速地找到元素总和最大的子矩阵。 
下面是该算法的实现代码。 


it getMaxHatrix(int[][] original) { 
int maxArea - Integer.MIN_VALUE; // 注意，最大总和 T 龌小于 0 
int rowCount * original.length; 
int colunnCount ■ original[0].length; 
int[][] matrix » precomputeMatrix(original); 
for (int rowl ■ 0; roMl < rowCount; rowl-M-) { 
for (int row2 = rowl; row2 < rowCount; roM24-f) { 
for (int coll ■ 0; coll < colunnCount; coll4-f) { 

for (int col2 ■ coll; col2 < colunnCount; col24-f). 
maxArea * Math.max(maxArea, computeSum(matrix > 
rowl, row2, coll, col2)); 


1 int[][] preco«puteHatrix(int[][] Matrix) { 

’ int[][] sumMatrix = new int[natrix.length][aatrix[ 0 ].length]; 

for (int i = 0 ; i < natrix.length; i++) { 
for (int j - 0; j < Matrix. length; j-M-) { 
if (i == 0 && j »= e ) { // 筝一个单元 
sumMatrix[i][j] - «atrix[i][j]; 

> else if (j *= 0 ) { // 蓽一列的单元 

sumMatrix[i] 【 j 】 -su«Matrix[i - l][j] + aatrix[i][j]; 

> else if (i == 0 ) { // 蓽一行的单元 

sumMatrix[i][j] * sunHatrix[i][j - 1] ♦ »atrix[i][j]; 


;umMatrix[i][j] = suaHatrix[i - l][j] + 

su«Hatrix[ij[j - 1] - sunMatrix[i - l】[j - 1] 
iiatrix[i][j]; 
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34 > 

35 } 

36 return sumMatrix; 

37 > 

38 

39 int computeSum(int[][] sunHatrix, int il, int i2, int jl, int j2) { 

40 if (il «= 0 && jl == 0) { // 从行 0, 列 0 开始 

41 return sunMatrix[i2][j2]; 

42 > else if (il == 0) { // 从行 0 开始 

43 return sunHatrix[i2][j2] - suaHatrix[i2]【jl • 1]; 

44 } else if (jl ― 0) { // 从列 0 开始 

45 return sunHatrix[i2][j2] - suaMatrix[il - 1][j2]; 

46 > else { 

47 return sunHatrix[12][j2] - sunHatrix[i2][jl - 1] 

48 - sunMatrix[il - l][j2] <f sumMatrix【il • l][jl - 1 ]； 

49 > 

50 } 

3 ■优化后的 解法： 0(/^) 

信不信由你，但确实有个更优的解法。如果矩阵为及行 C 列，我们可以在 0(/^0 时间内解出 
此题。 

回想一下找出最大总和的子数组 问题： 给定一个整数数组，找出元素总和最大的子数组。我 
们有办法在0(的时间内找到 （ 元索总和）最大的子数组，该解法也可用来求解此题。 

每个子矩阵都可以表示为一组连续的行和一组连续的列。如果要迭代所有连续行的组合，那 
么，对每一种组合找出一组可给出元素总和最大的列，就可以了。也就是说： 

1 maxSum ■ 0 

2 foreach rowStart in rows 

3 foreach rowEnd in rows 

4 /* 我们有一姿子矩萍， rowStart 为 

5 • 矩阵上边 . rowEnd 为矩降 下边， 

6 * 找出 colStart 和 colEnd 左名 ■ 甬边， 

7 * 使得总和最大 V 

8 maxSum = max (runningHaxSun, aiaxSun) 

9 return maxSum 

现在，问题转变为如何高效地找出“最好"的 colStart 和 colEnd ? 此题变得越来越有意思了。 
假设有如下子 矩阵： 


rowStart 


9 

-8 | 

1 

3 

-2 

-3 

7 

6 

-2 

4 

6 

-4 

-4 

8 

-7 

12 

-5 

3 

9 

-5 


rowEnd 





我们想要找到相应的 colStart 和 colEnd , 使得 rowStart 为上边、 rowEnd 为下边的子矩阵元 
素总和最大。为此，我们可以把每一列加起来，然后应用此题开头解释过的 maxSubArray 函数。 

在前面的例子中，总和最大的子数组是第1列到第4^。这就意味着最大子矩阵为 ( rowStart , 
first column ) 到 （ rowEnd , fourth column ) 0 
至此，可写出大致如下的伪码。 

1 maxSum = 0 

2 foreach rowStart in rows 

3 foreach rowEnd in rows 

4 foreach col in coluans 

5 partialSun[col] ■ sun of Matrix[rowStart, col] through 

6 Matrix [rowEnd # col] 

7 runningHaxSum = naxSubArray(partialSun) 

8 maxSum - nax<runningHaxSun i naxSun) 

9 return maxSuiR 

第5、谢计算总和需用时 ( 要循环访问 rowStart 至 rowEnd ), 因此全部用时 0(/? 3 C )。 不 
过，大功尚未吿成。 

在第5、6行，从头将 a [0]... a [ i ] 加起来，即使在外层 for 循环的前一次迭代时已计算过 
a [ 0 ].. . a [ i - l ] 的总和。这部分重复的计算完全可以砍掉不要。 

1 maxSum ■ e 

2 foreach rowStart in rows 

3 clear array partialSu* 

4 foreach rowEnd in rows 

5 foreach col in coluans 

6 partialSu_ 【 col] natrix[rowEnd, col] 

7 runningHaxSum * maxSubArray(partialSun) 

8 maxSuiR 囂 max(runningHaxSum, maxSum) 

9 return maxSum 

最终，完整的代码大致 如下： 

1 public void clearArray(int[] array) { 

2 for (int i ■ 0; i < array.length; i-M-) { 

3 array[l] - 0; 

4 > 

5 } 

6 

7 public static int MaxSubHatrix(int[][] Matrix) { 

8 int rowCount a Matrix.length; 

9 int colCount * Matrlx[0].length; 

10 

11 int[] partialSum = new int[colCount]; 

12 int maxSuw = 0; // 最大总扣是个空板阵 

13 

14 for (int rowStart = 0; rowStart < rowCount; rowStart++) { 

15 clearArray(partialSun); 

16 

17 for (int rowEnd = rowStart; rowEnd < rowCount; rowEnd++) { 

18 for (int i » 0; i < colCount; i++) { 
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19 partialSum[i] += i»atrix[rowEnd][i]; 

20 } 

21 

22 int tempMaxSum 二 maxSubArray(partialSu_, colCount); 

23 

24 /* 如欲追琮坐标，将相关代码 

25 * 放在这里 V 

26 raaxSum ■ Math.max(maxSun^ tempMaxSum); 

27 > 

28 > 

29 return maxSum; 

30 } 

31 

32 public static int maxSubArray(int array[], int N) { 

33 Int maxSum s 0 ； 

34 int runningSum « 0; 

35 

36 for (int i = 0; i < N; i++) { 

37 runningSum array[i]; 

38 inaxSum - Math.max(maxSuii > runningSum); 

39 

40 /* 若 runningSun < 0, 就没必要再鱸績了 • 

41 * 重里 V 

42 if (runningSum < 0) { 

43 runningSum « e ； 

44 } 

45 > 

46 return maxSum; 

47 > 

此题非常复杂，若没有面试官的大量提示和帮助，在面试中很难周全地解出整个问题。 

18.13 给定几百万个单词的满单，设 计一个 籌法，创建由字母组成的最大 矩形. 其中 
每一行 组成一个单词（自左向右），每 一列也组成一 个单词（自上而下)。不要求这些单词在湳单 
里连续出现，但要求所有行等长，所有列等高。 （ 第106页） 


解法 

很多与字典有关的问题，通过预先做些处理就51以解出来。对于此题，哪一部分可以做预处 
理呢？ 

好吧，如果要创建一^单词矩形，就必须满足以下 要求： 每一行等长，每一列等高。因此，我 
们可以将这个字典的单词按长短进行分组，姑且把这个分组叫作 D , 其中 D [ i ] 包含长度为 i 的单词串。 

接下来，观察要找的最大矩形。可能形成的绝对最大的矩形有多大呢？它会是 length 
(largest word )2。 

1 int maxRectangle = longestMord * longestMord; 

2 for z = maxRectangle to 1 { 

3 for each pair of numbers (i, j) where i*j - z { 

4 /* 试着用单均构建矩形，成功 ) M 返 a */ 
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从最大可能的矩形迭代至最小的矩形，可以保证第一个找到的符合要求的矩形就是题目要求 
的最大矩形。 

现在，轮到困难的部分： makeRectangle(int 1, int h ) D 这个方法试图构建长搞 A 的单词 

矩形。 

—种做法是迭代所有长 A 的有序单词集合，然后检査每一列字母是否形成有效单词。这么做 
也行得通，但是非常低效。 

假设我们正试着构造 6 x 5 的矩形，前几行单词 如下： 

there 

queen 

pizza 


至此可知，第一列开头几个字母为 tqp 。 我们知道或者说应该知道，字典里没有以 tqp 开头的 
单词。既然明摆着最终创建不出有效的矩形，为何还要自寻烦恼，继续构造下去呢？ 

这就引出一个更优的解法。我们可以构逑一棵单词査找树 （ trie ), 从而轻易査出某个子串是 
否为字典里单词的前缀。然后，在一行一行自上而下构造矩形时，检奄每一列字母是否均为有效 
前缀。如果不是，则立即失败并中止，不再继续构造这个矩形。 

下面是该算法的实现代码，长且复杂，下面我们会逐步解说。 

—开始会做些预处理， 将申词 按长度分组。我们会创建一个单词杳找树（每一个 trie 包含某 
长度的单词）数组，但直到真正时，才会构建单间査找树。 


1 Mord6roup[] groupList = MordGroup.createWordGroups(list); 

2 int maxMordLength - groupList.length; 

3 Trie trieList[] * new Trie[maxWordLength]; 

maxRectangle 方法是代码的 ••主 体”，从卩 f 能的最大矩形 （ maxWonJLengtf ^ ) 开始，然后试 
着构建该大小的矩形 o 若构建失败，该方法会将最大面积减一，并尝试新的、较小的尺寸。由此， 
笫一个成功构建的矩形必定是最大的。 


Rectangle maxRectangle() { 

int maxSize ■ maxWordLength * maxWordLength; 
for (int z * naxSize; z > 0; z--) { // 从最大面枳开始 
for (int i ■ 1; i <■ maxWordLength; i*~fr) { 

if (z % i == 0 ) { 
int j - z / i; 
if (j <= maxWordLength) { 

/* 构速长度 i 、 高度 ; J 的矩形 . ii 意， 

傘 i ♦ j « z ♦/ 

) Rectangle rectangle ■ makeRectangle(i 4 j); 

if (rectangle != null) { 

! return rectangle; 
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maxRectangle 又调用了 makeRectangle 方法，用于构造指定长度和高度的 矩形。 


1 



Rectangle makeRectangle(int length, int height) { 
if (groupList[length• 1】 ■■ null || 
groupList[height-l] ■■ null) { 



/* 若不存在，軋构建该单均长度的 trie •/ 
if (trieList[height • 1】 ■■ null) { 

LlnkedList<String> words ■ groupList[height • 1].getWords(); 
trieList[height - 1] = new Trie(words); 


return makePartialRectangle(length, height, 

new Rectangle(length)); 


makePartialRectangle 方法真正负责构建矩形，参数为预期的最终长度和高度以及部分成 
形的矩形。如果矩形的高度已达到最后想要的高度，就直接査看每一列能否构成有效、完整的单 
同，然后返回。 

否则，检査每一列字母能否构成有效前缔。如若不能，就立即中止，因为这个部分成形的矩 
形最后不可能构建出有效的矩形。 

不过，如果到目前为止一切顺利，所有列都是有效的单词前缀，那么，就继续搜索相应长度 
的单同，追加至当前矩形的后面，然后进人递归试着以 { 追加中新单同的矩形 } 为基础构建矩形 9 


Rectangle makePartialRectangle(int 1, int h. Rectangle rectangle) { 
if (rectangle.height — h) { // 輪查板形是否已完成 
if (rectangle.isCo«plete(l, h, groupList[h • 1])) { 
return rectangle; 



return null; 


r 将所有列与 trie 比较，撿壹是否有效 V 
if (I rectangle.isPartialOK(l, trieList[h - 1])) { 
return null; 


/* 迭代访问该长度的所有单均，并加入 
* 当前的部分萑形，然后试着遂归构建出 
* «形 */ 

for (int 1 - 0; i < groupList[1-1].length(); !♦+) { 
/* 当前矩形加上新单句构建新挺形 */ 

Rectangle orgPlus ■ 

rectangle.append(groupList[l-l].getWord(i)); 


/♦ 试着以这个新的、部分矩形构建新矩形 •/ 

Rectangle rect * nakePartialRectangle(l, h, orgPlus); 
if (rect !* null) { 



return rect; 


26 

27 

28 

29 return null; 

30 } 

Rectangle 类代表一个部分或完整的单词矩形，可以调用方法 isPartialOk 来检査矩形到目 
前为止是否有效（即每一列都是有效的单同前缀)。方法 iscomplete 的功能类似，不过只检査每 
一列是否为完整的单词。 

1 public class Rectangle { 

2 public int height, length; 

3 public char [】【] Matrix; 

4 

5 /* 均 it 一个 " 空 ~ 的崔形，长度是 ffl 定的， 

6 * 俚高度会随着单的加入而变化 V 

7 public Rectangle(int 1) { 

8 height > 0 ; 

9 length * 1; 

10 > 

11 

12 /* 枨据指定长度和高度的字符教 to 

13 * 构速矩形， 使用梢 定的字母板阵 

14 • 表示（镢定参数指定的长度和高 

15 • 度与数妞麥数的大小 

16 * 相符 > •/ 

17 public Rectangle(int length, int height, char [][】 letters) { 

18 this.height * letters.length; 

19 this.length ■ letters[0].length; 

20 matrix « letters; 

21 > 

22 

23 public char getLetter (int i, int j) { return aatrix[i][j]; > 

24 public String getColumn(int i) { ... } 

25 

26 /* 枪查所有列是否部为有效.蚜有列已知为 

27 • 有效的，因为它们是崖接从字典里取出的 •/ 

28 public boolean isCoaplete(int 1, int h, yordGroup groupList) { 

29 if (height ― h) { 

30 /* 检壹暑一列是否为字典里的单句 */ 
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44 for (int i » 0; i < 1; i++ ) { 

45 String col = getColumn(i); 

46 if (Itrie.contains(col)) { 

47 return false; 

48 > 

49 > 

50 return true; 

51 > 

52 

53 /* 在当前矩形上追加 s 来新建 

54 * Rectangle *V 

55 public Rectangle append(String s) { ... } 

56 } 

WordGroup 类是个 简单的容器，包含某长度的所有单词。为方便査找，我们会将单词储存在 
散列表和 ArrayList 中。 

WordGroup 中的列表由静态方法 createWordGroups 创建。 
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36 int wordLength = list[i].length() - 1; 

37 if (groupList[wordLength] =« null) { 

38 groupList[MordLength] = new WordGroup(); 

39 } 

40 groupList[wordLength].addWord(list[i]); 

41 } 

42 return groupList; 

43 > 



此题完整代码（包括 Trie 和 TrieNode 的），可在本书所附的源码包里找出。注意，面对复杂 
如是的问题，你很可能只需要写出伪码即可。毕竟.要在这么短的时间内写出全部代码几乎是不 
可能的。 





M 


死锁， 98,103,298,299,300,301 
随机数发生器， 106,332 


蛮力法 ， 165, 166,192,224,274,334,348 丁 

面试准备表格 ， 18 

面向对象设计 , 30,64 try/catch 语句块 , 90,284,285 

模块化代码， 36,37 

模式匹配法 , 31,58,126,225,265 W 


N 

内存滑漏 , 270,279 

P 

排列组合 , 32,68,105,223,229,230,332 
排序 ,29,73,255,256, 

归并排序， 14,28,73,74,256 
基数排序， 73,76 
快速排序， 28,73,75,256 
W 泡棑序 ,73 
桶排序 ,73,257 
外»排序 ,259 
选择排序， 74,338 
碰撞冲突 , 45,66,219,220, 221.275 

S 

S.A.R. 法 , 25,26 
设计棋式 ,28,64,65 
深度优 宄搜索 ,28, 52,53 
时间表 ,1,3,42 

二叉査找树 ,51, 

二叉树 ,28,33,51 
后绝树 ,159,341 

平衡树 , 52,53,146,151,153,156 
前序遍历 , 52,150, 159 
中序遍历 , 52,150,151, 154,159,267 
数据库非规范化， 93,97 
数据库规范化 , 93,94,97,292,293 


网络爬虫 ,73,249 

位搡作 ， 28, 34, 44, 47, 54, 55, 69, 107, 163, 164, 165, 166, 
168. 169, 171,306,332 
位向置 ,108, U6, 246,247,248,249 

X 

XML, 104,105,211,242,243,320 
行为面试题 ,6,16,18,23,25 
析构甬数 , 84, 85, 86. 89,278,279 
系败， 34 

系统设计 ,2,14,15,69,71,251 
先进先出 ,50, 51. 142,145 
虚拟 ,272,275,278 
虚函数表 ,28,275 
虚拟机 ,284,285 

Y 

引用计数 ,89,279,280 

Z 

指败 , 34,41,59,67,222,322 
秩， 77,267,268 

中序遍历 , 52, 150,151,154,159,267 
重写 , 90,91.92, 99,238,285 
重載， 86,87,91 
组合败学 ,228 
祖先结点， 52 
最长递增子序列 ,265,314 








